人工智能 关键字列表
企业级AI将成为VivaTech 2026的核心议题

企业级AI将成为VivaTech 2026的核心议题

TechCrunch与VivaTech 2026达成合作,共同聚焦推动下一波创新浪潮的技术、创始人与理念。欧洲企业AI生态系统正迅速崛起,制造、物流、医疗、网络安全等行业成为AI经济的重要战场。随着AI从实验阶段走向规模化生产,企业面临治理、合规、安全与系统集成等深层挑战。VivaTech 2026将成为探讨企业级AI基础设施与落地实践的重要平台。

Zest:基于真实消费数据的AI餐厅发现应用正式上线

Zest:基于真实消费数据的AI餐厅发现应用正式上线

Zest是一款新上线的餐厅发现应用,通过关联用户信用卡消费记录,结合AI技术,根据用户真实就餐数据生成个性化餐厅推荐。该应用已获得来自Alexis Ohanian和Steve Jang共计180万美元的种子前轮融资。上线数周内已吸引逾10万次访问。用户可通过Plaid安全导入餐饮消费数据,生成个人就餐地图,并关注好友或创作者的推荐。未来Zest还计划拓展至购物等更多城市生活场景。

记忆工具为何会让AI模型表现更差

记忆工具为何会让AI模型表现更差

AI助手的自适应能力被视为核心卖点,但Writer公司最新研究揭示了潜在隐患。研究人员发布两篇论文,指出主流记忆系统(如Mem0和Zep)会导致模型过度迎合用户偏好,甚至将用户的错误认知带入答案。随着记忆上下文不断积累,模型的准确性反而下降,在财务分析等专业场景中尤为明显。研究者强调,所有记忆系统在区分"相关上下文"与"无关锚点"时都存在根本性困难,可能引入偏差并削弱系统实用价值。

Anthropic建议:在AI与人类目标对齐之前应放缓研究进程

Anthropic建议:在AI与人类目标对齐之前应放缓研究进程

Anthropic资深研究人员在新博文中警告,AI系统可能很快具备自我改进能力,其速度将超出人类有效监督的范围,重新引发"对齐问题"的担忧。研究人员提出三种未来情景,其中最令人担忧的是AI实现完全递归自我改进。Gartner预测,到2028年15%的日常工作决策将由自主AI完成,但也警告40%的企业可能因治理失败而在2027年前下线AI代理。分析师指出,AI治理已从模型层面延伸至运行时行为管控,监督机制须嵌入系统架构之中。

DiffusionGemma:文本生成速度提升4倍的全新扩散式大语言模型

DiffusionGemma:文本生成速度提升4倍的全新扩散式大语言模型

谷歌推出实验性开源模型DiffusionGemma,采用文本扩散技术,突破传统自回归大模型逐词生成的限制,改为同时生成256个token的完整文本块。该模型基于Gemma 4架构,参数规模26B(MoE),推理时仅激活3.8B参数,在单张NVIDIA H100上可达每秒1000+tokens,速度最高提升4倍。支持双向注意力机制,适合代码补全、行内编辑等场景,已在Hugging Face开放下载。

NVIDIA加速Google DeepMind的DiffusionGemma本地AI推理

NVIDIA加速Google DeepMind的DiffusionGemma本地AI推理

谷歌DeepMind发布了实验性开源模型DiffusionGemma,采用并行扩散方式生成文本,每步可同时处理最多256个token,而非逐词生成。NVIDIA对其进行了深度优化,使其在GeForce RTX GPU、RTX PRO工作站及DGX Spark等设备上实现更高性能。在单张H100 GPU上可达1000 tokens/秒,比同等自回归模型快约4倍。该模型基于Gemma 4架构,采用Apache 2.0开源协议,支持Hugging Face、vLLM等主流框架。

从122TB QLC到本土端到端能力,Solidigm用长期主义服务中国客户

长期主义的定力,正是Solidigm在AI存储超级周期中引领行业的密码之一。

YouTube Music重新设计界面,搜索功能移至Android与iOS底部导航栏

YouTube Music重新设计界面,搜索功能移至Android与iOS底部导航栏

YouTube Music近期对Android和iOS应用进行了界面调整,将"搜索"功能移至底部导航栏,取代原有的"探索"标签。底部栏其余的主页、短视频和媒体库标签保持不变,右上角则专用于个人资料菜单和通知入口。新版搜索页面整合了原探索页内容,包括新发行、排行榜、心情与流派及播客等。此次更新自iOS 9.22和Android 9.21版本起推出,提升了单手操作便利性,与主流流媒体应用布局趋于一致。

Gemini应用新增谷歌商家资料整合与商业笔记本功能

Gemini应用新增谷歌商家资料整合与商业笔记本功能

谷歌近日宣布为Gemini应用新增两项面向企业用户的功能。一是整合Google Business Profile,让Gemini能够访问商家评价、客户问题及运营数据,为业主提供个性化建议与内容。二是推出"商业笔记本"功能,支持整合商家资料与网站信息,帮助用户分析业务趋势、生成品牌内容并基于客户评价进行创意头脑风暴。上述功能将于本月在全球范围内陆续向Gemini应用推出。

AI深度投入企业每月人均AI支出达7500美元

AI深度投入企业每月人均AI支出达7500美元

据Ramp AI指数最新研究,美国企业中AI投入最高的1%公司,每名员工每月AI支出达7500美元,被称为"AI狂热"企业。尽管这一数字相当可观,但仍低于软件工程师约16000美元的月均薪资。前10%的企业每员工月均支出约611美元,中位数仅为11.38美元。值得关注的是,"AI狂热"企业上月人均AI支出环比增长14.1%,这些企业倾向于混合使用多个前沿模型与开源平台以控制成本。

Chips&Media向Ambarella授权最新一代视频编解码器IP,深化全球边缘与物理AI市场战略合作

Chips&Media向Ambarella授权最新一代视频编解码器IP,深化全球边缘与物理AI市场战略合作

韩国视频IP领军企业Chips&Media宣布,已向边缘及物理AI芯片市场领导者Ambarella授权其最新一代视频编解码IP。此次合作经过严格技术评估,双方将聚焦自动驾驶、智能安防、物联网、工业自动化及机器人等领域。该最新架构支持8K超高分辨率视频处理,在功耗、性能、带宽和面积(PPBA)方面实现全面优化,将为Ambarella下一代边缘AI SoC提供核心竞争力支撑。

Neura Robotics完成14亿美元C轮融资,加速构建实体AI平台

Neura Robotics完成14亿美元C轮融资,加速构建实体AI平台

认知机器人公司Neura Robotics宣布完成高达14亿美元的C轮融资,估值预计在80亿至150亿美元之间。本轮融资汇聚了Tether、高通、亚马逊、英伟达、博世、舍弗勒、欧洲投资银行等全球顶尖机构。融资资金将用于认知机器人的全球部署、Neuraverse平台扩展、Neura训练场建设及下一代物理AI系统研发。该公司现有订单超过10亿美元。

机器遗忘审计新框架:用正则化f散度核测试提升AI隐私验证效率

机器遗忘审计新框架:用正则化f散度核测试提升AI隐私验证效率

研究人员提出了一种名为"正则化f散度核检验"的新框架,旨在提升机器学习模型遗忘审计的精度与效率。该框架通过相对距离测试,判断已执行遗忘操作的模型是否更接近安全重训模型,从而有效避免传统双样本检验产生的误报问题。实验表明,该方法在隐私审计中仅需数千个样本即可检测出违规行为,显著优于现有基准方法,为GDPR合规验证与AI安全审计提供了更可靠的数学工具。

Gemini应用出现局部服务中断故障

Gemini应用出现局部服务中断故障

周三上午,谷歌Gemini应用出现局部服务故障,部分用户持续收到"Something Went Wrong 1099或1076"错误提示,或遭遇提示词被原样退回文本框的异常情况。此次故障波及Web、Android、iOS、macOS等多平台及Chrome浏览器内的Gemini功能。Workspace侧边栏约于太平洋时间凌晨3:30起出现问题。谷歌Josh Woodward已于上午10:31确认故障并表示正在积极修复中。

自动驾驶卡车公司Einride正式登陆纳斯达克

自动驾驶卡车公司Einride正式登陆纳斯达克

瑞典自动驾驶货运科技公司Einride宣布,其美国存托股份和认股权证已正式在纳斯达克全球市场和纳斯达克资本市场上市,股票代码分别为"ENRD"和"ENRDW"。Einride成立于2016年,拥有30家全球客户,潜在商业机会超8亿美元,目标市场规模达4.6万亿美元。公司核心AI平台Saga可整合车辆遥测、充电基础设施、路线规划及需求数据,全面优化货运运营效率。

纽约直面数据中心扩张浪潮:如何在发展与电网改革之间寻求平衡

纽约直面数据中心扩张浪潮:如何在发展与电网改革之间寻求平衡

纽约州正面临数据中心快速扩张带来的电网压力。2026年2月,民主党议员提出一项议案,拟对超过20MW的新建数据中心实施三年暂停令;与此同时,州长霍楚尔指示公共服务委员会启动电网接入改革程序。截至2026年2月,纽约独立系统运营商的大型负荷待审项目已达11.9GW。改革核心议题包括成本分摊、电网可靠性及气候目标协调,相关利益方可在2026年5月13日前提交意见。

DiffusionGemma发布:本地AI推理速度提升4倍

Google DeepMind推出Gemma 4开源模型家族新成员DiffusionGemma,采用类似图像生成的扩散机制,能并行生成整块文本,而非逐个token线性输出。该模型为MoE架构,总参数260亿,推理时仅激活38亿,可在高端消费级GPU上运行。测试显示,RTX 5090可达约700 tokens/秒,H100可突破1000 tokens/秒,约为同规模自回归模型的4倍。该模型已在Hugging Face以Apache 2.0协议开放下载。

Hermes与Ollama组合:我测试过众多桌面AI工具后找到的新宠

Hermes与Ollama组合:我测试过众多桌面AI工具后找到的新宠

作者长期测试各类本地部署AI工具,近期发现了一款名为Hermes的自主智能体应用。Hermes不仅支持普通对话,还集成了工具配置、技能管理、语音交互、文件查看及定时任务等功能,并可与开源工具Ollama配合免费使用。文章详细介绍了在Linux、macOS和Windows上的安装流程,并演示了用Hermes构建黑胶唱片库管理应用的实际体验,展示了其自主推理、记忆学习和多后端支持等核心优势。

思科转型软件巨头的战略全景解析

思科转型软件巨头的战略全景解析

思科正从以交换机、路由器为核心的硬件业务,向软件与服务战略全面转型。其第三季度财报显示,49%的季度收入已来自订阅模式。思科的战略核心在于安全与网络可视化,并瞄准AI智能体身份管理这一新兴市场,近期宣布收购Astrix Security以强化布局。此外,思科推出统一管理平台Cloud Control,但产品整合仍是最大挑战。面对HPE、Palo Alto等竞争对手,思科凭借庞大装机基础保持领先优势。

Xcode 27 集成 Gemini,大幅扩展智能体编程工具集

Xcode 27 集成 Gemini,大幅扩展智能体编程工具集

苹果在Xcode 27中新增对Google Gemini的原生支持,开发者现可在Claude Code和OpenAI Codex之外,直接使用Gemini完成代码规划、编写与审查。此前,Xcode 26.3已引入智能体编程功能,26.5进一步支持消息队列与澄清性问答。Xcode 27还带来了全新界面、工作区、交互式规划及多轮问答等改进,进一步完善了苹果的AI辅助开发工作流。