据报道,在一份员工问题的 AI 总结中,Hassabis 被问及公司可以从 DeepSeek 的成功中学到"什么经验和启示"。他向员工表示,DeepSeek 声称的训练具有竞争力的 AI 模型的低成本可能"只是"其实际花费的"一小部分",并且这家 AI 初创公司可能使用了比其声称更多的硬件。据报道,他还告诉员工,DeepSeek 很可能依赖于西方 AI 公司的先进模型。
据报道,Hassabis 对员工表示:"事实上,我们拥有比 DeepSeek 更高效、性能更好的模型。因此,我们对自己的战略非常镇定和自信,我们具备在今年保持领先地位的所有要素。"
Google 和 DeepMind 均未立即回应置评请求。
据 CNBC 报道,本周早些时候,在巴黎 AI 行动峰会的 Google 活动上,Hassabis 表示杭州这家初创公司的 AI 模型"可能是"中国"最好的成果",而且"令人印象深刻"。Hassabis 表示 DeepSeek 展示了"极其出色的工程能力",其 AI 模型具有更深层的地缘政治意义。
然而,据 CNBC 报道,他也表示 DeepSeek 并未展示"真正的科学突破",而是"使用了" AI 行业的"已知技术"。
上个月,DeepSeek 发布了其最新开源推理模型 DeepSeek-R1 的结果,该模型在多个行业基准测试中的表现可与 OpenAI 的推理模型 o1-mini 和 o1 相媲美。去年 12 月,该初创公司推出了 DeepSeek-V3 模型,称其在 Nvidia (NVDA-1.42%) 的 H800 芯片(Nvidia H100 芯片的降级版本,供美国公司使用)上的训练和开发成本仅为 560 万美元。
DeepSeek 这种低成本却具有竞争力的模型引发了人们对科技巨头在 AI 基础设施上的巨额支出的质疑,同时也让人思考美国芯片出口管制的有效性。
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。