据报道,在一份员工问题的 AI 总结中,Hassabis 被问及公司可以从 DeepSeek 的成功中学到"什么经验和启示"。他向员工表示,DeepSeek 声称的训练具有竞争力的 AI 模型的低成本可能"只是"其实际花费的"一小部分",并且这家 AI 初创公司可能使用了比其声称更多的硬件。据报道,他还告诉员工,DeepSeek 很可能依赖于西方 AI 公司的先进模型。
据报道,Hassabis 对员工表示:"事实上,我们拥有比 DeepSeek 更高效、性能更好的模型。因此,我们对自己的战略非常镇定和自信,我们具备在今年保持领先地位的所有要素。"
Google 和 DeepMind 均未立即回应置评请求。
据 CNBC 报道,本周早些时候,在巴黎 AI 行动峰会的 Google 活动上,Hassabis 表示杭州这家初创公司的 AI 模型"可能是"中国"最好的成果",而且"令人印象深刻"。Hassabis 表示 DeepSeek 展示了"极其出色的工程能力",其 AI 模型具有更深层的地缘政治意义。
然而,据 CNBC 报道,他也表示 DeepSeek 并未展示"真正的科学突破",而是"使用了" AI 行业的"已知技术"。
上个月,DeepSeek 发布了其最新开源推理模型 DeepSeek-R1 的结果,该模型在多个行业基准测试中的表现可与 OpenAI 的推理模型 o1-mini 和 o1 相媲美。去年 12 月,该初创公司推出了 DeepSeek-V3 模型,称其在 Nvidia (NVDA-1.42%) 的 H800 芯片(Nvidia H100 芯片的降级版本,供美国公司使用)上的训练和开发成本仅为 560 万美元。
DeepSeek 这种低成本却具有竞争力的模型引发了人们对科技巨头在 AI 基础设施上的巨额支出的质疑,同时也让人思考美国芯片出口管制的有效性。
好文章,需要你的鼓励
Xbench是知名投资机构红杉中国推出一款全新的AI基准测试工具,旨在真实地反映AI的客观能力,其在评估和推动AI系统提升能力上限与技术边界的同时,会重点量化AI系统在真实场景的效用价值,并采用长青评估的机制,去捕捉AI产品的关键突破。
这项研究首次将在线强化学习成功应用于流匹配模型,通过巧妙的ODE到SDE转换和去噪减少策略,显著提升了AI图像生成的精确度和可控性。在复合场景生成、文字渲染等任务上取得突破性进展,为AI生成领域开辟了新的技术路径。
Atlassian总裁Anu Bharadwaj在Transform 2025大会上分享了公司AI智能体规模化的实践经验。她强调,成功部署AI智能体需要营造实验文化,而非仅依靠自上而下的指令。Atlassian通过Rovo Studio平台为各团队提供了构建定制化智能体的环境,创造心理安全的工作氛围,鼓励员工大胆尝试和迭代。公司客户通过该平台显著提升了工作效率,建筑行业客户将路线图创建时间缩短75%。
这篇由阿里巴巴集团联合多所知名高校发表的综述论文,系统梳理了统一多模态理解与生成模型的最新发展。研究将现有模型分为扩散、自回归和混合三大类型,详细分析了不同图像编码策略的特点,整理了相关数据集和评估基准,并深入探讨了当前面临的技术挑战。