谷歌DeepMind发布AlphaEarth Foundations AI模型,能处理每日数TB卫星数据追踪地表变化。该模型如"虚拟卫星"般将全球陆地和沿海水域映射为数字表示,帮助科学家监测食品安全、森林砍伐、城市扩张等关键问题。模型整合光学卫星图像、雷达、激光测绘等数据源,以10×10米精度追踪变化,错误率比其他模型低24%。
ChatGPT虽然是目前最受欢迎的AI聊天机器人,但它并非万能。文章指出11个不应该使用ChatGPT的场景:诊断健康问题、处理心理健康、紧急安全决策、个人财务税务规划、处理机密数据、违法行为、学术作弊、监控实时信息、赌博预测、起草法律文件以及创作艺术。AI可能产生错误信息、缺乏实时数据更新,在高风险场景下可能造成严重后果。用户应了解其局限性,在关键决策时寻求专业帮助。
ServiceNow正构建数据基础架构支持AI智能体应用,解决企业AI部署的最大障碍"数据地狱"。公司推出三大核心组件:AI原生数据库RaptorDB、工作流数据结构Workflow Data Fabric,以及收购的数据目录平台Data.world。该公司还推出AI控制塔提供统一管理,并计划扩展商业智能分析领域,挑战传统BI厂商。
清华大学团队开发出革命性人形机器人系统Being-0,具备类人思维能力。该系统采用创新的"三层大脑"架构:顶层基础模型负责理解指令和制定策略,中间层连接器模块负责将计划转化为具体动作,底层技能库负责执行各种操作。机器人能够理解自然语言,自主规划复杂任务如制作咖啡,并在动态环境中灵活调整策略,在长期任务中达到84.4%的成功率。
微软升级了Azure AI Speech服务,用户仅需几秒钟的语音样本即可快速生成逼真的语音复制品。该个人语音功能于2024年5月21日正式发布,采用名为"DragonV2.1Neural"的零样本文本转语音模型,支持100多种语言。微软表示新版本在语音自然度、韵律稳定性和发音准确性方面都有显著提升,可用于定制聊天机器人语音、视频配音等应用。尽管微软要求用户遵守使用政策并获得原说话者同意,但该技术仍可能被恶意使用。
vivo和香港中文大学的研究团队开发了UI-R1系统,首次将强化学习技术应用到图形界面操作中。该系统仅用136个训练样本就能让AI学会操作手机、电脑界面,在跨平台测试中表现优异,为智能设备交互开辟了高效的新路径。
新加坡国立大学研究团队开发了IPV-BENCH,首个专门评估AI视频模型处理"不可能场景"能力的基准测试平台。研究发现,当前最先进的AI视频模型在生成和理解违反物理定律、生物规律等不可能场景时表现不佳,最好的生成模型成功率仅37.3%,理解模型在时间推理方面尤其困难,揭示了AI技术在创造力和复杂推理方面的重大局限性。
香港科技大学研究团队提出PreSelect方法,通过分析文本对不同AI模型能力的预测能力来筛选高质量训练数据。该方法基于"能够准确反映模型能力差异的文本往往也是最佳训练材料"的核心洞察,仅用轻量级fastText分类器就能实现大规模数据筛选,在多项实验中展现出10倍训练效率提升,为AI模型开发提供了经济高效的解决方案。
Google Research与以色列理工学院联合研究发现,大型语言模型存在显著的"隐性知识"现象——AI内部掌握的知识远超其外部表现,平均差距达40%。研究团队通过测试三个主流AI模型的1700个事实性问题,发现AI在内部完全知道答案但1000次尝试都不会说出的极端情况。这一发现揭示了AI语言生成机制的根本局限,为改进AI表现和理解智能系统认知机制提供了新视角。
西安交通大学团队提出MAPS多智能体系统,基于心理学大七人格理论设计7个专门化AI智能体协作解决多模态科学问题。系统采用苏格拉底式质疑方法进行自我监督,在数学、物理、化学问题求解上比现有最佳AI提升15.84%,甚至超越人类专家3.58%,为AI协作系统设计提供了新思路。
复旦大学研究团队开发出革命性的AI机器人训练方法"双重偏好优化",让机器人具备预测行动后果的"想象力"。该方法通过同时优化动作选择和状态预测,使7B参数模型的任务成功率提升31.4%,规划效率提升33.0%,甚至超越GPT-4o表现。研究建立了自动化数据收集系统和VoTa-Bench测试平台,为实现更智能的机器人助手奠定基础。
阿里达摩院推出VACE系统,这是首个能够统一处理文字转视频、视频编辑、遮罩编辑等12种视频任务的AI模型。通过创新的视频条件单元(VCU)和上下文适配器架构,VACE不仅能单独完成各类视频生成编辑任务,还支持任务组合创造出传统方法无法实现的效果,为视频创作提供了革命性的一站式解决方案。
上海AI实验室等机构联合开发的Dita机器人学习模型实现重大突破,仅需10个示例就能让机器人掌握复杂任务。该模型创新性地结合扩散模型与Transformer架构,让机器人具备类似人类的环境观察和任务理解能力,在多个基准测试中表现优异,并成功完成包括倾倒液体、多步骤操作等高难度真实世界任务,为通用机器人智能发展开辟新路径。
Canonical宣布Ubuntu 25.10"Questing Quokka"将引入基于可信平台模块(TPM)芯片的全盘加密功能。该功能原计划在23.10版本推出,现在终于落地。新方案利用现代PC内置的TPM 2.0芯片存储加密密钥,支持自动解锁,无需手动输入密码。系统要求PC具备TPM 2.0芯片、UEFI固件并启用安全启动。相比传统LUKS加密方案,TPM加密可实现无人值守启动,特别适合服务器环境。该功能将采用统一内核镜像系统,通过snap包管理内核更新。
创新光学无线网络全球论坛在五周年之际与国际电信联盟签署合作协议,旨在加速光子技术发展。该项目由NTT主导,联合爱立信、诺基亚等巨头,致力于构建全光子网络基础设施,应对AI驱动的数据中心增长需求。研究显示,全球数据中心容量2024至2027年将增长57%,迫切需要更高带宽、更低延迟和能耗的网络解决方案。
乐天移动宣布选择思科、诺基亚和F5作为合作伙伴,共同支持其在日本的5G独立组网建设。该网络将采用云原生和AI驱动系统,旨在简化运营、降低成本并提升客户体验。作为2019年推出全球首个端到端云原生移动网络的先驱,乐天移动此次通过战略合作进一步推进网络自主运营。同时宣布在九州等地区扩大5G覆盖范围。
Meta公司报告运营成本和研发支出增长,正加速推进人工智能业务。公司成立Meta超级智能实验室,专注开发下一代AI模型。CEO扎克伯格表示将建设多个千兆瓦级集群,包括明年上线的1千兆瓦Prometheus集群和可扩展至5千兆瓦的Hyperion集群。最新财报显示收入成本增长16%,资本支出达170亿美元用于服务器、数据中心和网络基础设施投资。
AI繁荣面临电力问题,但真正制约因素在基础设施层面。随着生成模型规模扩大,传统铜线互连开始不堪重负。硅光子技术使用光而非电传输数据,速度更快、功耗更低。以色列初创公司Teramount获得5000万美元A轮融资,专注光纤芯片连接器。据预测,协封装光学市场将在2028年达到21亿美元。AI数据中心电力需求可能在2026年翻倍,大部分电力消耗在数据传输而非计算。
面对地缘政治不稳定和AI快速发展,CIO们在制定2026年预算时更加谨慎。德勤CTO指出,变化速度前所未有,CIO需投资于具备可移植性的架构和团队建设。AI进步正影响预算分配,特别是计算资源和使用量预测方面。专家建议CIO应关注全栈工程能力、网络安全和云AI集成,同时平衡长期愿景与短期执行,为研发预留预算以应对不确定性。
随着AI智能体热度持续攀升,业界出现了一种观点认为这些突破性AI工具将终结长期主导的SaaS商业模式。微软CEO纳德拉等专家预测,AI智能体将具备多数据库操作功能,使底层SaaS工具变得过时。不过也有专家认为这种观点过于简化,虽然智能体会替代GUI界面交互,但SaaS后端功能仍然必要。当前SaaS公司正竞相转型为智能体平台,而智能体也需要SaaS的数据和合规框架支持。