人工智能已成为2025年IT领导者最大的关注焦点。在经济环境仍然困难的背景下,技术领导者需要将AI融入整体战略,管理过度炒作的期望,同时严控成本、应对技能短缺和确保网络安全。本文精选了Computer Weekly对全球顶级技术领导者的十大访谈,涵盖BBC研发总监、英国地形测量局CTO、汤森路透COO等,展示他们如何在各自领域运用AI技术改善业务。
随着英国政府发布AI机遇行动计划,确定了2025年数据中心发展议程。政府承诺快速提升AI数据中心基础设施容量,建立AI增长区,降低规划壁垒。然而,随着AI数据中心热潮兴起,能源安全担忧持续存在,超大规模需求放缓引发关注。Gartner预测到2030年数据中心用电量将翻倍,英国国家电网启动350亿英镑投资计划应对挑战。
2025年成为东南亚地区AI应用的转折点,各组织从实验性AI项目转向大规模商业化部署。马来西亚Ryt银行和越南Techcombank等金融机构采用智能AI和统一数据平台,实现复杂交易处理和个性化客户服务。渣打银行和菲律宾Metrobank等重点投资数据基础设施现代化。马来西亚公共部门为50万公务员配备生成式AI工具,新加坡研究人员利用AI技术攻克帕金森病难题,展现AI在解决社会挑战方面的巨大潜力。
扫地机器人制造商iRobot申请破产保护,其中国制造合作伙伴准备接手资产。尽管Roomba拥有二十多年历史和强大品牌认知度,但公司始终无法盈利。现实是家用电器对智能家居概念免疫,消费级机器人技术无法应对复杂的现实生活场景。投资者明白在AI炒作与现实体验之间存在巨大鸿沟,这解释了为何资本更青睐遥不可及的人形机器人项目。
超大规模数据中心运营商在过去三年因AI热潮几乎将基础设施支出增加了两倍,每季度新增运营容量增长170%。据Synergy Research数据,第三季度季度资本支出达到1420亿美元,增长近180%。全球超大规模数据中心数量已达1297个,是2018年的三倍。美国占全球超大规模运营容量的55%。目前已知的未来设施管道有770个,预计总容量将在12个季度内翻倍。
System76发布了基于Ubuntu 24.04的Pop OS长期支持版本,同时推出完全用Rust重新构建的COSMIC桌面环境"Epoch 1"版本。经过四年开发,这个全新桌面环境在处理多屏显示、分辨率切换和窗口管理方面表现出色,被认为是目前最先进的Wayland桌面环境之一,为GNOME和KDE带来了强有力的竞争。
Meta AI首次发布多模态奖励评估基准MMRB2,专门评价AI同时处理文字和图像的能力。该基准包含四大任务类型共4000个专家标注样本,测试23个先进模型。结果显示最佳模型Gemini 3 Pro达75-80%准确率,仍低于人类90%水平。研究揭示AI评价存在视觉偏见等问题,为多模态AI发展提供重要参考标准。
蚂蚁集团联合多所知名大学成功开发LLaDA2.0扩散语言模型系列,最大版本拥有1000亿参数。该研究突破了传统语言模型的串行生成限制,采用并行生成方式,在保持高质量输出的同时显著提升推理速度。通过创新的三阶段转换策略,成功将现有自回归模型转化为扩散模型,避免了从零训练的高昂成本。
香港理工大学研究团队发布DeContext技术,这是首个专门针对新型AI图像编辑模型的防护系统。该技术通过精准干扰AI模型的注意力机制,能有效阻止恶意用户利用个人照片制作虚假内容或进行身份冒充,同时保持图像的视觉质量几乎不变。实验显示身份相似度可降低至0.12,为AI时代的图像隐私保护提供了重要解决方案。
美国多州和部分国家要求特定应用进行年龄验证,澳大利亚已禁止16岁以下用户使用社交媒体。新提案《应用商店问责法案》建议由苹果和谷歌负责统一验证用户年龄,而非各开发者单独验证。这将提升用户体验,用户只需向苹果或谷歌验证一次身份。凭借苹果在隐私保护方面的优势,该方案可扩展至Safari浏览器,为需要年龄验证的网站提供确认信息,而无需透露用户个人数据。
AI编程助手Cursor背后的公司Anysphere宣布收购AI代码审查工具初创公司Graphite。据报道收购价远超Graphite今年早些时候B轮融资时2.9亿美元的估值。此次收购具有战略意义,将AI代码生成与AI代码审查工具相结合,可大幅提升从编写到交付的整体效率。Anysphere估值已达290亿美元,近期频繁收购,上月收购技术招聘公司,今年7月还收购AI客户关系管理初创公司Koala的团队。
OpenAI为ChatGPT推出个性化设置功能,用户可自主调节AI的温暖度和热情程度,选择"更多"或"更少"个性特征。新功能还支持调整表情符号、标题和列表使用频率,并可选择古怪、专业、友好、愤世嫉俗等不同性格特点。同时优化了邮件编写体验,支持直接在对话中更新和格式化文本,用户可高亮特定文字段落并要求ChatGPT进行针对性修改。
哥伦比亚大学等机构研究团队发现,在AI模型的强化学习训练中存在一个悖论现象:阻碍探索和阻碍利用竟然都能提升性能。研究揭示了裁剪技术实际是熵调节器而非学习信号,策略熵与性能无直接因果关系,并提出奖励错配理论解释随机奖励的积极效果,为AI训练方法设计提供了新的理论基础。
本研究由香港科技大学和商汤科技联合完成,提出CVD-STORM框架,通过创新的STORM-VAE模块实现了自动驾驶场景的多视角长视频生成与4D场景重建的统一。该方法在FID和FVD指标上分别相比最优基线提升34%和61%,并首次实现了从生成视频中直接提取准确的绝对深度信息,为自动驾驶世界模型的发展开辟了新方向。
腾讯AI实验室联合港校提出RePlan框架,解决复杂图像编辑中的指令理解和精确定位难题。该方法采用"计划-执行"架构,让视觉语言模型先推理制定区域级编辑计划,再通过创新的注意力机制精确执行。仅用1000个样本训练就超越了大规模数据训练的模型,在新建的IV-Edit基准上表现出色。
香港科技大学团队开发的WorldCanvas AI框架实现了视频创作的重大突破。用户只需手绘运动轨迹、输入文字描述和参考图片,即可生成精确可控的视频内容。该系统通过空间感知技术解决多角色场景的精确控制问题,在轨迹跟踪、语义理解等方面显著超越现有模型,为视频制作、游戏开发、教育等领域带来革命性应用前景。
新加坡南洋理工大学团队开发了一种新型AI视觉处理技术——对数线性稀疏注意力,通过模仿人类分层观察的方式,将AI图像处理的计算复杂度从平方级降低到对数线性级。该技术在256×256像素图像处理中实现了28倍的速度提升,同时保持生成质量不变,为高分辨率AI图像生成提供了突破性解决方案。
普林斯顿大学等机构联合开发的SonicMoE技术,针对专家混合模型训练效率问题提出了系统性解决方案。通过重新设计内存管理、利用GPU异步处理能力和创新的令牌舍入路由方法,SonicMoE将训练速度提升近一倍,内存使用量减少45%,为大规模AI模型训练提供了更经济高效的路径。
LG电视通过系统更新强制安装微软Copilot快捷方式引发争议。虽然LG承诺将允许用户删除该图标,但仍计划在webOS系统中深度整合Copilot功能。三星等厂商也在推进类似AI功能。专家指出,智能电视内置聊天机器人会增加隐私追踪的复杂性,加剧系统臃肿问题。当前智能电视行业正通过用户追踪和广告实现软件盈利,消费者应关注隐私保护问题。
网络安全提供商Palo Alto Networks宣布将把关键内部工作负载迁移至谷歌云平台,交易金额近百亿美元。双方将在AI领域深度合作,Palo Alto Networks将使用谷歌Gemini大语言模型为其产品提供AI能力,包括漏洞检测和网络故障排除等功能。此外,公司还将帮助客户保护基于谷歌Vertex AI平台的工作负载,并深化VM-Series虚拟防火墙与谷歌云的集成。