据报道,在一份员工问题的 AI 总结中,Hassabis 被问及公司可以从 DeepSeek 的成功中学到"什么经验和启示"。他向员工表示,DeepSeek 声称的训练具有竞争力的 AI 模型的低成本可能"只是"其实际花费的"一小部分",并且这家 AI 初创公司可能使用了比其声称更多的硬件。据报道,他还告诉员工,DeepSeek 很可能依赖于西方 AI 公司的先进模型。
据报道,Hassabis 对员工表示:"事实上,我们拥有比 DeepSeek 更高效、性能更好的模型。因此,我们对自己的战略非常镇定和自信,我们具备在今年保持领先地位的所有要素。"
Google 和 DeepMind 均未立即回应置评请求。
据 CNBC 报道,本周早些时候,在巴黎 AI 行动峰会的 Google 活动上,Hassabis 表示杭州这家初创公司的 AI 模型"可能是"中国"最好的成果",而且"令人印象深刻"。Hassabis 表示 DeepSeek 展示了"极其出色的工程能力",其 AI 模型具有更深层的地缘政治意义。
然而,据 CNBC 报道,他也表示 DeepSeek 并未展示"真正的科学突破",而是"使用了" AI 行业的"已知技术"。
上个月,DeepSeek 发布了其最新开源推理模型 DeepSeek-R1 的结果,该模型在多个行业基准测试中的表现可与 OpenAI 的推理模型 o1-mini 和 o1 相媲美。去年 12 月,该初创公司推出了 DeepSeek-V3 模型,称其在 Nvidia (NVDA-1.42%) 的 H800 芯片(Nvidia H100 芯片的降级版本,供美国公司使用)上的训练和开发成本仅为 560 万美元。
DeepSeek 这种低成本却具有竞争力的模型引发了人们对科技巨头在 AI 基础设施上的巨额支出的质疑,同时也让人思考美国芯片出口管制的有效性。
好文章,需要你的鼓励
PDF协会在欧洲会议上宣布,将在PDF规范中添加对JPEG XL图像格式的支持。尽管Chromium团队此前将该格式标记为过时,但此次纳入可能为JXL带来主流应用机会。PDF协会CTO表示,选择JPEG XL作为支持HDR内容的首选解决方案。该格式具备广色域、超高分辨率和多通道支持等优势,但目前仍缺乏广泛的浏览器支持。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
Ironclad OS项目正在开发一个新的类Unix操作系统内核,面向小型嵌入式系统,计划支持实时功能。该项目的独特之处在于采用Ada编程语言及其可形式化验证的SPARK子集进行开发,而非常见的C、C++或Rust语言。项目还包含运行在Ironclad内核上的完整操作系统Gloire,使用GNU工具构建以提供传统Unix兼容性。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。