这项由上海人工智能实验室等多家国际机构联合完成的研究系统性地梳理了大语言模型高效架构的最新进展。论文将创新方法分为七大类:线性序列建模、稀疏序列建模、高效全注意力、稀疏专家混合、混合架构、扩散语言模型和跨模态应用。研究揭示了如何在保持AI能力的同时大幅降低计算成本,为AI技术的可持续发展和广泛应用提供了重要指导。
中科院深圳先进技术研究院团队首次全面梳理了大型语言模型评测领域,分析了283个代表性基准,将其归纳为通用能力、领域专业和特定目标三大类别。研究揭示了现有评测体系面临的数据污染、文化偏见和静态评测等关键挑战,为构建更科学公正的AI评测框架提供了重要指导,推动人工智能技术向更安全可靠的方向发展。
思科推出8223路由系统和Silicon One P200芯片,用于满足企业日益增长的AI工作负载需求。该系统提供51.2 Tbps以太网固定路由器,P200芯片实现超过3艾比特每秒的互连带宽规模。新设备采用深缓冲设计,相比前代产品节能65%,支持跨数据中心AI集群分布式部署,解决物理空间和电力容量限制问题。
智能AI代理正成为软件开发的新宠,企业高管希望通过AI代理提升效率。尽管开发者对AI生成代码的质量存在担忧,但其潜在价值巨大。调查显示三分之二企业正在或计划使用多个AI代理进行软件测试,72%认为到2027年智能AI可实现自主测试。专业化的精简测试代理比大型模型更适合特定任务,需要建立负责任的信任框架来管理AI代理行为,但人工测试仍不可替代。
全球食品饮料行业正经历重大变革,AI系统在配方开发、减少浪费、可持续发展和供应链预测等领域发挥重要作用。雀巢在多个业务领域使用生成式AI,通过AI技术精准预测需求模式、动态调整生产和库存水平,并在产品配方开发中运用机器学习模型。同时,雀巢探索AI在碳追踪、制造业视觉系统等方面的应用以支持环保目标。
IBM在techExchange2025开发者大会上宣布与Anthropic建立合作伙伴关系,将Claude模型集成到Watsonx平台。同时发布自研Spyre AI加速器,将于10月28日开始向System z大机出货,12月12日支持Power系统。Spyre支持实时迁移推理工作负载,8卡配置可提供1TB内存和超过2.4千万亿次运算性能。IBM还推出基于多种AI模型的Project Bob集成开发环境,内部测试显示开发效率提升45%。
谷歌今日发布Gemini Enterprise,这是一个集成了先进AI模型、聊天机器人和智能代理的一体化企业平台。该平台提供统一聊天界面,可安全连接各种数据源,包括Google Workspace、Microsoft 365等企业应用。平台内置超过1500个AI代理,支持无代码构建工具,用户可创建自动化工作流程。标准版年费每席位每月30美元起。
OpenAI推出的AI视频生成应用Sora在不到五天内下载量突破100万次,增长速度超过ChatGPT。该应用类似TikTok,提供无限垂直视频流,但所有视频均由AI生成。用户只需输入提示词即可创建10秒视频,还可通过Cameo功能制作个人视频。尽管目前仅在北美地区开放且需要邀请码使用,但已引发版权争议和娱乐行业反弹。
由两名前谷歌DeepMind研究人员创立的Reflection AI获得20亿美元融资,估值达80亿美元,较七个月前暴涨15倍。公司正将自己定位为OpenAI等封闭实验室的开源替代方案,以及中国DeepSeek等AI公司的西方对标。团队约60人,已构建大规模AI训练平台,计划明年发布前沿语言模型。公司采用开放模型权重但保留数据集专有的策略,目标客户为大型企业和政府主权AI系统。
华中科技大学联合华为和上海交大研究团队开发出革命性3D人体重建系统Snap-Snap,仅需正面和背面两张照片即可在190毫秒内生成完整3D人像。该技术突破了传统方法对昂贵设备和复杂人体先验模型的依赖,通过智能几何推理和侧面增强算法实现高质量重建,为虚拟现实、游戏开发等领域的大众化应用奠定基础。
这项研究介绍了aiXiv——首个专为AI科学家设计的开放学术平台。该平台由多伦多大学等18个机构联合开发,支持AI独立完成论文提交、同行评审和发表全流程。通过多智能体架构和五阶段安全防护机制,平台实现了81%的评判准确率,并显著提升了AI生成研究的质量。这标志着科学研究范式的重大转变。
斯坦福大学研究团队开发了UQ评测系统,用人类未解决的真实难题来测试AI能力,而非传统的标准答案题目。系统包含500个来自Stack Exchange的高质量未解问题,采用AI验证器初筛和人类专家终审的双重验证机制。测试显示,即使最先进的AI模型也只能解决极少数问题,揭示了当前AI在面对真正困难问题时的局限性,为AI评测开辟了更真实有效的新方向。
FastMesh是新加坡南洋理工大学开发的革命性3D网格生成技术,通过分离处理顶点和面片,将传统方法的标记数量减少到23%,实现8倍速度提升。该技术采用自回归模型生成顶点,用双向变换器构建面片,并配备保真度增强器优化细节质量。在标准测试中表现优异,生成1000顶点模型仅需7秒,为游戏、影视、VR等行业提供了高效的3D内容创作解决方案。
南洋理工大学团队开发的CineScale技术能让AI视频生成模型在不重新训练的情况下,将分辨率从原始大小提升至8K图像和4K视频。该技术通过定制自级联放大、约束膨胀卷积和尺度融合三大核心组件,有效解决了高分辨率生成中的重复图案问题,支持文本到视频、图像到视频等多种生成任务,为AI视频创作领域带来重大突破。
希伯来大学研究团队开发的Story2Board系统实现了从文字故事到专业故事板的自动转换突破。该系统采用潜在面板锚定和相互注意力数值混合两项核心技术,在保持角色一致性的同时实现丰富的视觉表现力。系统无需训练即可运行,能够生成电影级构图效果的连续画面,为内容创作、教育和娱乐产业提供了强大的AI辅助工具,代表了人机协作创作的新模式。
上海AI实验室等机构联合开发的SongGen系统实现了AI音乐生成的重大突破,能够在单一阶段同时生成人声和伴奏,用户只需输入歌词和描述就能创作完整歌曲。该系统提供混合和双轨两种生成模式,支持语音克隆功能,在多项评估中超越传统多阶段方法。研究团队还构建了包含54万样本的开源数据集,并将完整代码和数据公开发布,为AI音乐创作的民主化奠定基础。
亚马逊AI实验室联合莫纳什大学开发的Cyber-Zero框架,首次实现了无需运行环境的网络安全AI训练。通过分析公开CTF解题报告,用双AI模型模拟真实解题过程,生成高质量训练数据。训练后的开源模型性能可媲美顶级商业模型,在成本效益上具有显著优势,为网络安全AI技术普及化提供了新路径。
这项研究开发了CellForge系统,通过多个AI专家协作自动化虚拟细胞建模全流程。系统在六种不同生物学场景测试中全面超越现有方法,预测误差最高降低40%,相关性提升20%。该技术将传统需要数月专家协作的工作压缩至几小时,成本从数千美元降至几美元,有望大幅降低科研门槛并加速生命科学发现。
阿里巴巴Quen团队发布了图像生成模型Qwen-Image,在复杂文字渲染和精准图像编辑方面实现重大突破。该模型通过创新的数据处理流程和渐进式训练策略,不仅在英文文字渲染上表现出色,更在中文字符生成方面远超现有模型,准确率达到58.30%。同时具备多任务处理能力,可进行图像编辑、深度估计、新视角合成等操作,为AI图像生成技术开启新纪元。
BITS Goa团队联合Meta AI和Amazon AI开发的AlignGuard-LoRA技术,创新性地解决了AI微调过程中的安全性流失问题。该方法通过Fisher信息矩阵识别安全关键参数,将更新分解为安全维护和任务学习两个独立组件,并设计碰撞感知正则化防止组件干扰。实验显示,该技术能将安全漂移降低50%,同时保持任务性能不变。