DeepSeek登场,企业级AI构建路径解析 原创

这股来自东方的神秘力量“DeepSeek”究竟是何许人也,竟能震惊美国科技界。连OpenAI CEO Sam Altman都称DeepSeek是一个“令人印象深刻”的模型。

春节档,除了贺岁片的热闹,还有DeepSeek的出圈。

这股来自东方的神秘力量“DeepSeek”究竟是何许人也,竟能震惊美国科技界。连OpenAI CEO Sam Altman都称DeepSeek是一个“令人印象深刻”的模型。但他也表示,OpenAI依然相信自己将继续走在技术前沿,推出更出色的产品,并且对迎接这个新竞争者表示欢迎。

让我先花几分钟来介绍下DeepSeek,其成立于2023年7月17日,是幻方量化旗下的AI公司,专注于实现通用人工智能(AGI)。2024年1月5日DeepSeek推出其首个大模型DeepSeek LLM,随后2024年12月26日,DeepSeek发布全新系列模型DeepSeek-V3的首个版本,并同步开源。2025年1月27日,发布的DeepSeek-R1模型,以低训练成本、高性能、开源等特点受到关注,短短几天迅速攀升至Apple手机应用商店美国区免费应用榜首,单周下载量高达约240万次。

DeepSeek-R1模型在多项国际评测中表现突出,追平了OpenAI o1模型,这都是源于技术与工程创新,也是全世界都在讲的低成本的关键所在。

据介绍,DeepSeek-R1模型的训练成本仅为560万美元,训练成本只有Llama 3的1%,远低于OpenAI、谷歌和Meta等美国科技巨头在AI领域数亿至数十亿美元的投入。凭借更低的成本,DeepSeek-R1实现了与现有前沿模型相当的效果,这也引发了市场对此前投资回报的担忧。

在2024 re:Invent上,亚马逊CEO Andy Jassy分享了亚马逊自身部署人工智能中的三项关键洞察恰好呼应了DeepSeek的成功。首先,随着生成式AI应用规模的扩大,计算成本变得至关重要。人们非常渴望获得更高的性价比。其次,构建一个真正优秀的生成式AI应用实际上非常困难。第三,当我们让开发者自由选择他们想要使用的模型时,模型的多样性显而易见。这并不让我们感到意外,因为我们一次又一次地学到同样的教训:永远不会有单一的工具能够统治世界。

DeepSeek登场,企业级AI构建路径解析

亚马逊CEO Andy Jassy

模型架构设计、训练策略、基础设施优化、商业模式都是DeepSeek的成功因素,各大厂商也纷纷跟进,宣布支持DeepSeek,亚马逊云科技就是其中一员。

亚马逊云科技的用户现在可以在Amazon Bedrock和Amazon SageMaker AI中轻松部署DeepSeek-R1系列模型,目前提供4种部署方式:第一,在Amazon Bedrock Marketplace部署DeepSeek-R1模型;第二,通过Amazon SageMaker JumpStart部署DeepSeek-R1模型;第三,利用Amazon Bedrock的自定义模型导入功能部署DeepSeek-R1-Distill模型;第四,使用Amazon EC2 Trn1实例部署DeepSeek-R1-Distill模型。

Amazon Bedrock Marketplace为客户提供100多个热门、新兴及专业模型,Amazon Bedrock适合希望通过API快速集成预训练基础模型的团队,Amazon SageMaker AI则更适合需要深度定制、训练、部署并能访问底层基础设施的企业。

DeepSeek登场,企业级AI构建路径解析

通过Amazon Bedrock Marketplace部署DeepSeek-R1,可选实例包括EC2 P5e的48xlarge型号,单个实例包含8颗H200 GPU,以及3200Gbps的网络带宽,充分满足DeepSeek-R1的性能需求。

DeepSeek登场,企业级AI构建路径解析

在Amazon SageMaker Jumpstart中快速部署DeepSeek模型。

DeepSeek登场,企业级AI构建路径解析

在Amazon Bedrock模型定制页面部署DeepSeek 8BLlama Model

亚马逊云科技不用过多介绍,全球第一个云服务就出自于此。在大模型时代,亚马逊云科技仍然走在潮头,为企业运用全球领先模型上提供三大独特优势:

云端优势:亚马逊云科技一直在云端进行创新,提供了丰富且成熟的分析、数据等基础服务进行无缝集成。推出基于自研芯片Amazon Trainium2的EC2 Trn2实例,性价比比当时GPU实例高30%-40%;第二代的UltraCluster网络架构,支持超过20,000个GPU协同工作,带宽达10Pb/s,延迟低于10ms,这一突破性升级将模型训练时间缩短至少15%。新一代Amazon SageMaker,将快速SQL分析、PB级大数据处理、数据探索和集成、模型开发和训练以及生成式AI等功能统一到一个集成平台。

多样化的模型选择优势:俗话说,“铁打的应用,流水的模型”,仅用一个模型打遍天下是不可能的,需要因场景需求进行取舍,实现最优的性价比组合。亚马逊云科技也在2024 re:Invent上发布了Amazon Nova六种新基础模型,Amazon Bedrock的朋友圈也在扩大,覆盖了AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等领先厂商。

企业级AI工具全家桶:Amazon Bedrock不仅可以提供各种先进模型,已经进化为一站式生成式AI解决方案,第一,优化效果、延迟和成本:如低延迟优化推理、模型蒸馏、提示词缓存等功能,大幅提升推理效率;第二,基于企业自有数据的定制优化:模型微调和知识库功能不断丰富,现支持GraphRAG等图数据,及高效从文档、图像、音频、视频中提取信息并转化为结构化格式的Amazon Bedrock Data Automation功能;第三,负责任AI的安全和审查:Amazon Bedrock不断增强Guardrails功能,例如加入自动推理检查,以识别事实性错误并提高回答准确性;第四,实现复杂功能的多智能体功能:Amazon Bedrock推出多智能体协作功能,客户可轻松构建和协调智能体执行复杂工作流程,精确分配任务并加速执行。

亚马逊云科技大中华区产品部总经理陈晓建表示:“亚马逊云科技是全球云计算的开创者和引领者,更是企业构建和应用生成式AI的首选。我们不仅在云的核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈取得突破,让不同层级的创新相互赋能、协同进化。我相信,只有这样全栈联动的大规模创新才能真正满足当今客户的发展需求,加速前沿技术的价值释放,助力各行各业重塑未来。”

OpenAI和DeepSeek的目标都是AGI(通用人工智能),可能是3年,5年甚至更长时间,然而在这个过程中,企业依然能够持续受益,在实际应用中创造出巨大价值。

来源:至顶网CIO与CTO频道

0赞

好文章,需要你的鼓励

2025

02/07

13:55

分享

点赞

邮件订阅