春节档,除了贺岁片的热闹,还有DeepSeek的出圈。
这股来自东方的神秘力量“DeepSeek”究竟是何许人也,竟能震惊美国科技界。连OpenAI CEO Sam Altman都称DeepSeek是一个“令人印象深刻”的模型。但他也表示,OpenAI依然相信自己将继续走在技术前沿,推出更出色的产品,并且对迎接这个新竞争者表示欢迎。
让我先花几分钟来介绍下DeepSeek,其成立于2023年7月17日,是幻方量化旗下的AI公司,专注于实现通用人工智能(AGI)。2024年1月5日DeepSeek推出其首个大模型DeepSeek LLM,随后2024年12月26日,DeepSeek发布全新系列模型DeepSeek-V3的首个版本,并同步开源。2025年1月27日,发布的DeepSeek-R1模型,以低训练成本、高性能、开源等特点受到关注,短短几天迅速攀升至Apple手机应用商店美国区免费应用榜首,单周下载量高达约240万次。
DeepSeek-R1模型在多项国际评测中表现突出,追平了OpenAI o1模型,这都是源于技术与工程创新,也是全世界都在讲的低成本的关键所在。
据介绍,DeepSeek-R1模型的训练成本仅为560万美元,训练成本只有Llama 3的1%,远低于OpenAI、谷歌和Meta等美国科技巨头在AI领域数亿至数十亿美元的投入。凭借更低的成本,DeepSeek-R1实现了与现有前沿模型相当的效果,这也引发了市场对此前投资回报的担忧。
在2024 re:Invent上,亚马逊CEO Andy Jassy分享了亚马逊自身部署人工智能中的三项关键洞察恰好呼应了DeepSeek的成功。首先,随着生成式AI应用规模的扩大,计算成本变得至关重要。人们非常渴望获得更高的性价比。其次,构建一个真正优秀的生成式AI应用实际上非常困难。第三,当我们让开发者自由选择他们想要使用的模型时,模型的多样性显而易见。这并不让我们感到意外,因为我们一次又一次地学到同样的教训:永远不会有单一的工具能够统治世界。

亚马逊CEO Andy Jassy
模型架构设计、训练策略、基础设施优化、商业模式都是DeepSeek的成功因素,各大厂商也纷纷跟进,宣布支持DeepSeek,亚马逊云科技就是其中一员。
亚马逊云科技的用户现在可以在Amazon Bedrock和Amazon SageMaker AI中轻松部署DeepSeek-R1系列模型,目前提供4种部署方式:第一,在Amazon Bedrock Marketplace部署DeepSeek-R1模型;第二,通过Amazon SageMaker JumpStart部署DeepSeek-R1模型;第三,利用Amazon Bedrock的自定义模型导入功能部署DeepSeek-R1-Distill模型;第四,使用Amazon EC2 Trn1实例部署DeepSeek-R1-Distill模型。
不同之处在于,Amazon Bedrock Marketplace为客户提供100多个热门、新兴及专业模型;Amazon Bedrock适合希望通过API快速集成预训练基础模型的团队;Amazon SageMaker AI则更适合需要深度定制、训练、部署并能访问底层基础设施的企业。

通过Amazon Bedrock Marketplace部署DeepSeek-R1,可选实例包括EC2 P5e的48xlarge型号,单个实例包含8颗H200 GPU,以及3200Gbps的网络带宽,充分满足DeepSeek-R1的性能需求。

在Amazon SageMaker Jumpstart中快速部署DeepSeek模型。

在Amazon Bedrock模型定制页面部署DeepSeek 8BLlama Model
亚马逊云科技不用过多介绍,全球第一个云服务就出自于此。在大模型时代,亚马逊云科技仍然走在潮头,为企业运用全球领先模型上提供三大独特优势:
云端优势:亚马逊云科技一直在云端进行创新,提供了丰富且成熟的分析、数据等基础服务进行无缝集成。推出基于自研芯片Amazon Trainium2的EC2 Trn2实例,性价比比当时GPU实例高30%-40%;第二代的UltraCluster网络架构,支持超过20,000个GPU协同工作,带宽达10Pb/s,延迟低于10ms,这一突破性升级将模型训练时间缩短至少15%。新一代Amazon SageMaker,将快速SQL分析、PB级大数据处理、数据探索和集成、模型开发和训练以及生成式AI等功能统一到一个集成平台。
多样化的模型选择优势:俗话说,“铁打的应用,流水的模型”,仅用一个模型打遍天下是不可能的,需要因场景需求进行取舍,实现最优的性价比组合。亚马逊云科技也在2024 re:Invent上发布了Amazon Nova六种新基础模型,Amazon Bedrock的朋友圈也在扩大,覆盖了AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等领先厂商。
企业级AI工具全家桶:Amazon Bedrock不仅可以提供各种先进模型,已经进化为一站式生成式AI解决方案,第一,优化效果、延迟和成本:如低延迟优化推理、模型蒸馏、提示词缓存等功能,大幅提升推理效率;第二,基于企业自有数据的定制优化:模型微调和知识库功能不断丰富,现支持GraphRAG等图数据,及高效从文档、图像、音频、视频中提取信息并转化为结构化格式的Amazon Bedrock Data Automation功能;第三,负责任AI的安全和审查:Amazon Bedrock不断增强Guardrails功能,例如加入自动推理检查,以识别事实性错误并提高回答准确性;第四,实现复杂功能的多智能体功能:Amazon Bedrock推出多智能体协作功能,客户可轻松构建和协调智能体执行复杂工作流程,精确分配任务并加速执行。
亚马逊云科技大中华区产品部总经理陈晓建表示:“亚马逊云科技是全球云计算的开创者和引领者,更是企业构建和应用生成式AI的首选。我们不仅在云的核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈取得突破,让不同层级的创新相互赋能、协同进化。我相信,只有这样全栈联动的大规模创新才能真正满足当今客户的发展需求,加速前沿技术的价值释放,助力各行各业重塑未来。”
OpenAI和DeepSeek的目标都是AGI(通用人工智能),可能是3年,5年甚至更长时间,然而在这个过程中,企业依然能够持续受益,在实际应用中创造出巨大价值。
好文章,需要你的鼓励
今天讲的出海案例是晶方科技,这家传感器先进封装公司通过 WaferTek 在马来西亚建设生产基地,并把新增 3000 万美元投向设备和产线。
这项研究揭示了大语言模型执行演绎推理时,仅约3%的注意力头构成关键"逻辑电路",分工明确,层层协作,一旦关闭这些电路,AI推理能力即刻崩溃。
随着企业将预算向AI倾斜,并大量采用AI编程助手,持H-1B签证的软件开发者正面临日益收窄的就业空间。Meta、亚马逊等科技巨头的裁员潮使工程类岗位需求进一步萎缩,招聘方越来越倾向于具备机器学习、数据科学等AI相关技能的候选人。分析人士指出,AI工具正压缩初级开发者的成长空间,企业也更偏向雇用绿卡持有者和本地公民,H-1B开发者须及早规划签证策略与技能升级路径。
Clark Hash是一种无需训练的句子嵌入压缩工具,将384维向量从1536字节压缩至48字节,通过稀疏随机投影与标量量化实现32倍压缩,同时保持高相似度相关性。