Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
谷歌宣布计划在印度安得拉邦维沙卡帕特南建立AI和数据中心枢纽,这是其在印度的首个AI专用设施。该项目是2026-2030年五年150亿美元投资计划的一部分,将整合大规模计算能力、可再生能源基础设施和扩展的光纤连接。该设施将与AdaniConneX和印度电信公司Airtel合作开发,预计提供"千兆瓦级计算能力"。项目还包括在印度东海岸建设新的海底电缆登陆站,扩大国际连接。
Eightfold联合创始人推出AI数字孪生初创公司Viven,获得3500万美元种子轮融资。该公司通过为每位员工创建专门的大语言模型数字孪生,让团队成员即使在同事不在线时也能获取关键信息。Viven通过访问员工的内部电子文档创建数字孪生,其他员工可查询获得即时答案。公司采用配对上下文和隐私技术确保信息安全共享。
由黑石、微软、英伟达、xAI和MGX组成的财团以约400亿美元收购Aligned Data Centers,创下数据中心收购纪录。该公司在北美和南美拥有50个数据中心,总容量达5GW。AI基础设施合作伙伴关系计划调动300亿美元股权投资,包含债务融资可达1000亿美元。高盛预测未来两年数据中心容量将激增50%,但警告当前AI投资存在狂热氛围,公司为避免落后而大举借债投资。
谷歌发布Veo 3.1 AI视频生成模型更新,显著改进了提示词遵循能力和图像转视频功能。新版本可同时生成视频和音频,并在Flow视频编辑器中新增"帧到视频"功能,用户可上传首尾帧自动生成中间内容。虽然在真实感方面仍不如OpenAI的Sora 2,但谷歌专注于为专业视频工作者提供实用工具的策略值得认可。
企业软件公司Infor将亚太地区作为关键增长引擎,凭借制造业软件专长和AI平台能力吸引新客户。CEO表示亚太制造业基础雄厚,是重要市场。公司专注年收入1亿至50亿美元企业,提供行业特定解决方案。通过Leap项目推动客户向云端迁移,与AWS合作解决数据主权问题。在AI方面,Infor开发智能代理功能,结合流程挖掘技术帮助企业识别低效工作流并实现实时自动化改进。
Anthropic发布了Claude Haiku 4.5小型AI语言模型,性能接近五个月前的前沿模型Claude Sonnet 4,但成本降低三分之二,速度提升一倍以上。该模型在SWE-bench编程测试中得分73.3%,与Sonnet 4的72.7%相当。API定价为每百万输入令牌1美元,输出令牌5美元,远低于其他大型模型。新模型专为实时低延迟任务设计,可与Sonnet 4.5协同工作处理复杂编程任务。
DAOS是英特尔Optane时代的并行文件系统产品,现已被英特尔抛弃。Enakta Labs等DAOS基金会成员正在重新激活这一高性能系统。DAOS曾在2023年IO500测试中获得1.3TBps带宽的顶级成绩。作为开源并行文件系统,DAOS需要与Storage Scale、Lustre等成熟产品竞争。Enakta Labs正在商业化DAOS,推出基于其的Enakta数据平台产品,支持S3、SMB、NFS和PyTorch。该公司认为DAOS凭借卓越性能和开源特性,有望在新兴云服务商中获得采用。
思科2025年AI准备度指数显示,尽管86%的企业期望AI在三年内提升员工生产力,但大多数公司在部署AI时缺乏必要的基础设施和明确策略。调查发现,54%的受访者表示其基础设施无法应对AI驱动的工作负载增长,仅15%认为网络具备足够灵活性。更关键的是,只有32%的企业明确了AI代理要执行的人类任务,31%准备好控制和保护AI代理系统。思科警告这种"AI基础设施债务"可能成为业务瓶颈。
半导体设计公司Arm与Meta达成合作伙伴关系,以增强这家社交媒体巨头的AI系统。根据协议,Meta的排名和推荐系统将迁移到Arm的Neoverse平台,该平台最近针对云端AI系统进行了优化。这项多年合作协议正值Meta大举投资扩建数据中心网络之际,包括代号"普罗米修斯"和"海伯利昂"的大型项目。
AI超大规模初创公司Nscale宣布与微软签署重大合作协议,将向欧洲三个数据中心和美国一个数据中心部署约20万块英伟达GB300 GPU。其中10.4万块GPU将在未来12-18个月内部署到德州数据中心,1.26万块将于2026年第一季度部署到葡萄牙数据中心。该协议还涵盖英国和挪威的数据中心建设计划。这家2024年成立的公司已融资超过17亿美元,计划最早明年底IPO。
字节跳动发布Seedream 4.0多模态图像生成系统,实现超10倍速度提升,1.4秒可生成2K高清图片。该系统采用创新的扩散变换器架构,统一支持文字生成图像、图像编辑和多图合成功能,在两大国际竞技场排行榜均获第一名,支持4K分辨率输出,已集成至豆包、剪映等平台,为内容创作带来革命性突破。
红帽公司研究团队提出危险感知系统卡(HASC)框架,为AI系统建立类似"体检报告"的透明度文档,记录安全风险、防护措施和问题修复历史。同时引入ASH识别码系统,为AI安全问题建立统一标识。该框架支持自动生成和持续更新,与ISO/IEC 42001标准兼容,旨在平衡透明度与商业竞争,建立更可信的AI生态系统,推动行业协作和标准化。
腾讯Hunyuan3D-Omni通过统一框架整合点云、体素、边界框和骨架四种控制信号,实现精准可控的3D物体生成。采用渐进式训练策略和统一控制编码器,解决了传统单一输入源导致的几何失真问题,为3D内容创作提供了更高的精度和灵活性,在动画制作、游戏开发等领域具有重要应用价值。
快手科技团队提出CE-GPPO算法,解决大型语言模型强化学习训练中的探索-利用平衡难题。通过重新利用传统方法丢弃的"越界"词元信息,实现对策略熵的精细控制。在数学推理任务上显著超越现有方法,7B模型性能提升3个百分点,为AI模型训练提供新思路。
马里兰大学研究团队首次使用舍恩菲尔德情节理论分析AI推理过程,发现先进AI模型的思考模式与人类学生解题过程惊人相似。通过对3000多个句子的详细标注,研究揭示了AI在七种思维模式间的转换规律,为理解AI"黑盒"提供了科学框架,并实现了80%准确率的自动化分析。
阿里巴巴联合人民大学开发的RecBot系统通过自然语言交互revolutionize推荐体验,用户可直接说"我要蓝色的但不要花纹"等指令,系统立即理解并调整推荐策略。该双智能体架构在三个月实际部署中显著提升用户满意度和商业指标,代表推荐系统从被动算法向智能助手的重要转型。
苹果公司发布SimpleFold,这是首个基于流匹配的蛋白质折叠模型,完全使用通用Transformer架构。该模型摒弃了传统方法中的多序列比对、配对表示等复杂组件,在保持竞争性能的同时实现了20倍以上的计算效率提升。SimpleFold支持多样性结构生成,在标准基准测试中表现出色,并展现良好的扩展性。