华为诺亚实验室等机构联合提出了一种创新的AI训练方法,通过双层优化框架让AI从数据中自动学习评价标准。该方法结合了传统最大似然估计和强化学习的优势,在表格分类和模型驱动强化学习任务中展现出更好的收敛性和泛化能力,为解决强化学习中缺乏明确奖励信号的问题提供了新思路。
NVIDIA等机构联合提出QeRL框架,通过自适应量化噪声技术实现大语言模型强化学习训练的效率与性能双重突破。该方法将显存需求减少60-70%,训练速度提升1.5倍以上,首次实现320亿参数模型单GPU训练,同时在GSM8K等数学推理测试中达到90.8%准确率,接近全参数训练效果。
纽约大学研究团队开发出突破性的表征自编码器(RAE)技术,颠覆传统图像生成思路。RAE直接利用已训练好的AI模型(如DINOv2)的知识,无需压缩就能生成高质量图片。配合新设计的DiTDH架构,在ImageNet测试中实现了1.51 FID的优异成绩,训练效率比传统方法提升数十倍,为内容创作、游戏开发等领域带来重大突破。
中科大和上海创新院团队开发出RLFR技术,通过分析AI内部"思维流动"来优化推理训练。该技术不只看答案对错,而是评估整个推理过程质量,就像监控河流流向一样引导AI形成连贯逻辑。在数学推理等测试中显示显著提升,让AI推理过程更稳定可靠。这项开源技术为构建更智能可信的AI系统提供了新路径。
新加坡国立大学等机构联合研究团队通过系统分析数据质量、算法优化和推理模式三个维度,破解了AI智能体学习难题。研究发现真实完整的训练数据、恰当的探索策略和深思熟虑的工具使用模式是关键。他们开发的4B参数DemyAgent模型在数学、科学等多项测试中超越了更大规模的模型,证明了"智慧胜过蛮力"的理念,为AI智能体发展指明了新方向。
这项由美国圣母大学和IBM研究院联合完成的突破性研究,首次提出了针对AI代理系统的预执行安全防护方案。研究团队开发了AuraGen数据生成引擎、Safiron安全守护模型和Pre-Exec Bench评估基准三大核心组件,能在AI代理执行动作前就识别潜在风险。实验显示该系统在安全检测准确率上显著超越现有方法,为AI代理的安全部署提供了重要保障。
微软和英伟达宣布新合作计划,将分别向AI公司Anthropic投资50亿和100亿美元,同时Anthropic承诺向微软云服务投入300亿美元。此举旨在减少AI行业对OpenAI的依赖,但也凸显了AI投资的循环性质。根据协议,Claude模型将通过微软、亚马逊、谷歌三大云服务商提供服务,而Anthropic将与英伟达在芯片和模型优化方面展开合作。
VAST Data将其AI操作系统软件栈移植到Azure平台,作为托管服务提供。该AI操作系统包含DataSpace、DataBase、DataStore等多层数据服务,构建在DASE存储架构之上。此次合作使客户能够在本地VAST部署、云环境和Azure之间无缝迁移工作负载,形成跨环境的混合AI数据架构。VAST正在构建覆盖主流公有云的全球存储数据架构。
DDN在SC25大会上发布了全新的CORE AI和HPC统一数据平面,整合了EXAScaler Lustre文件存储和Infinia对象存储系统,并推出A1400X3i和A12200新硬件。该公司声称其存储系统支持超过11000个客户的100万个GPU。CORE作为软件抽象层,统一管理本地部署和公有云实例,提供一致的AI数据性能,支持从模拟到训练、推理和检索增强生成的整个AI生命周期。
微软在旧金山Ignite大会上发布了新一代Cobalt 200 CPU,性能较前代提升50%,同时推出新的Azure AI工具用于构建和部署生成式及代理AI应用。该芯片专为Azure云原生应用优化,目前处于预览阶段。微软还宣布了Azure AI平台的多项增强功能,包括支持模型上下文协议、模型路由器等创新特性。
随着AI技术不断发展,交通运输行业正迎来重大变革。MIT研究显示,AI将很快自动化价值650亿美元的交通工作,大幅提升运输效率。从陆地到海空,AI正在推动全方位的交通创新。斯坦福专家强调,AI将通过基础模型、合成数据和数字孪生等技术,实现从单一车辆自动化到整个交通网络优化的跨越式发展,同时解决可持续性、安全性和公平性等关键挑战。
波兰研究团队开发ORCA数学基准测试,对五个主流大语言模型进行评估。结果显示ChatGPT-5、Gemini 2.5 Flash、Claude Sonnet 4.5、Grok 4和DeepSeek V3.2的准确率均低于63%。测试涵盖生物化学、工程建筑、金融经济等七个领域的500道数学题目。研究发现模型主要在四舍五入和计算错误方面存在问题,表明自然语言推理进步并未直接转化为可靠的计算能力。
美国能源信息署预测,2026年批发电力价格将上涨8.5%至每兆瓦时51美元,主要由数据中心和加密货币挖矿需求驱动。尽管可再生能源发电比例将达到创纪录的26%,加上核电18%的贡献,无碳发电将占总量44%,但整体碳排放变化不大。AI数据中心的快速增长成为电力需求最大推动因素,谷歌宣布到2027年在德州增投400亿美元建设数据中心。
GMI Cloud在台湾投资5亿美元建设AI工厂数据中心,将使用VAST Data存储系统为7000个Blackwell GPU提供数据支持。该项目与英伟达合作,GPU将配备NVLink、InfiniBand和Spectrum-X以太网网络,部署在96个机架中,每秒可处理约200万个令牌,功耗16兆瓦。VAST的EB级数据基础设施支持模型训练、推理和实时数据处理。
Meta超级智能实验室联合麻省理工学院开发了SPG三明治策略梯度方法,专门解决扩散语言模型强化学习训练中的技术难题。该方法通过上下界策略为AI模型提供精确的奖惩反馈机制,在数学和逻辑推理任务上实现了显著性能提升,为AI写作助手的智能化发展提供了新的技术路径。
上海AI实验室联合多所知名高校推出的Vlaser模型,成功将机器人的视觉理解、语言处理和精确行动能力统一在单一架构中。该模型基于600万个高质量训练样本构建,在12项综合测试中全面领先同类产品,实际机器人操作成功率超过64%,为机器人智能从工具向伙伴的转变奠定了重要基础。
这项由港大、美团、港中大联合开展的研究提出了CodePlot-CoT系统,让AI通过生成绘图代码来进行数学视觉推理。该系统解决了现有AI无法有效处理需要画图辅助的数学题难题,在专门构建的Math-VR数据集上取得21%的性能提升,为AI数学推理开辟了新方向。