北京时间12月3日00:00,亚马逊云科技re:Invent 2025进入第二日议程,亚马逊云科技首席执行官Matt Garman重磅发表《亚马逊云科技如何重塑云技术未来》的主题演讲,系统阐述了构建AI Agent所需的四大核心要素:AI基础设施、推理系统、数据、构建工具,重磅发布开创性的Amazon Nova 2系列基础模型和三大“前沿Agent”(Kiro Autonomous Agent、Amazon Security Agent、Amazon DevOps Agent),并宣布25项云核心服务重大创新,进一步拉大技术代差,巩固亚马逊云科技在全球云计算与AI领域的卓越地位。

构建AI Agent的四大核心要素
在大会的开始,Matt Garman首先阐释了对AI的趋势理解,他表示,Agentic AI技术正处于关键转折点,从“技术奇迹”转变为能提供实际业务价值的实用工具。他预测未来将有数十亿Agents在各行各业广泛运行,帮助企业实现10倍效率提升,而要让Agent真正发挥作用,需要四大核心要素的坚实支撑。

01.AI基础设施
提供强大且具成本效益的算力
Amazon Trainium芯片系列突破性进展
Matt Garman宣布正式发布Amazon Trainium 3 UltraServers,这是亚马逊云科技首款搭载3纳米工艺AI芯片的服务器,相较Amazon Trainium 2,不仅计算能力提升4.4倍、内存带宽提升3.9倍,每兆瓦算力可处理的AI token数量更实现了5倍增长。服务器最高配置144个芯片,提供惊人的362 petaflops FP8计算能力。在运行OpenAI的GPT-OSS-120B模型时,每兆瓦输出token数是Amazon Trainium 2的5倍以上,实现超高能耗比。

更令人振奋的是,Matt Garman首次披露了Amazon Trainium 4芯片,承诺将实现较Amazon Trainium 3六倍的FP4计算性能、四倍内存带宽和两倍高内存容量,持续巩固亚马逊云科技在AI芯片领域的长期领先地位。目前,亚马逊云科技已完成超100万个Trainium 2芯片的规模化部署,为Amazon Bedrock中大部分推理工作提供核心算力支持,包括Claude最新一代模型的高效运行。

GPU领域的深度合作与创新
亚马逊云科技与NVIDIA合作已达15年,是业界最早在云端提供NVIDIA GPU服务的厂商。Matt Garman特别强调,亚马逊云科技在GPU集群稳定性方面的表现远超行业其他提供商,通过深入细节优化(如调试BIOS预防GPU重启)和对每个问题进行根本原因分析,确保为客户提供业界卓越的GPU运行稳定性。新发布的P6e-GB 300实例搭载NVIDIA最新GB NVL 72系统,为最具挑战性的AI工作负载提供支持。OpenAI在亚马逊云科技上运行ChatGPT,使用数十万芯片的Amazon EC2 Ultra服务器集群,可扩展至超过千万CPU。
Amazon AI Factory突破数据主权限制
受与沙特阿拉伯Neom新创公司合作启发,亚马逊云科技推出开创性的Amazon AI Factory服务。这项服务允许在客户自有数据中心部署亚马逊云科技专用AI基础设施,运行体验与亚马逊云科技公有云区域一致,利用客户现有数据中心空间和电力,访问最新Amazon Trainium UltraServers或NVIDIA GPU,使用Amazon SageMaker和Amazon Bedrock服务,同时满足严格合规和数据主权要求。这为无法将数据迁移到云端的客户提供了完美解决方案。
客户案例:Vialet的科学突破
生物技术公司Vialet利用亚马逊云科技强大的AI基础设施训练“科学多面手”AI,已处理数万亿科学推理token,预计未来几年增长100倍。通过AI自主提出假设、设计并运行实验,Vialet正在加速药物研发和新材料发现,展示了强大AI基础设施如何推动科学突破。
02.推理系统
提供广泛的模型选择与极高性价比
Amazon Bedrock的全面扩展
Amazon Bedrock能够帮助客户快速将生成式AI应用从原型进入到生产环境,它的用户数量比去年同期增长了一倍以上,超过50个客户已处理超过1万亿个token。Amazon Bedrock提供广泛模型选择、基于使用场景定制模型、集成数据工具、添加安全护栏,与亚马逊云科技现有的服务和数据深度集成。
第三方模型体系持续丰富
Matt Garman宣布Amazon Bedrock新增Google Gemma、MiniMax M2、NVIDIA Nemotron、Kimi等开源权重模型。同时提供全新发布的Mistral 3系列,其参数量增加5倍以上、上下文窗口大小是Large 2的两倍,提供从超高效边缘设备到单GPU部署到高级本地的灵活操作。

Amazon Nova 2系列性价比的突破
亚马逊云科技重磅发布Amazon Nova 2系列,包括四大模型:





客户案例:Greatdeal的内容营销创新
内容营销公司Greatdeal需要在4到6周内,将20多个步骤和多个专业角色由创意转化为创意内容。通过使用Amazon Bedrock和Amazon Nova构建编排Agent,Greatdeal将涉及编辑、设计、网站等不同子Agent组合使用,显著加速内容生产流程,提升工作效率。
03.数据
让企业独有数据成为AI竞争优势
数据与模型集成的挑战
第三方模型无法深度适配企业特定业务数据,且企业专有数据不能嵌入公共可用模型。
Amazon Nova Forge开创性的“开放训练模型”
亚马逊云科技推出开创性的Amazon Nova Forge,引入“开放训练模型”概念。Amazon Nova Forge提供Amazon Nova训练检查点的独家访问,允许在模型训练的每个阶段混合企业专有数据与亚马逊云科技创建的训练数据集,产出的模型能够深度理解企业信息,同时保留核心能力。
该工作流程包括:从80%预训练的Amazon Nova 2 Light检查点开始,混合企业数据与亚马逊云科技训练数据集,使用提供的配方完成预训练,使用远程奖励函数和强化微调进一步改进,最后将模型导入Amazon Bedrock运行推理。

客户案例:Reddit的内容审核突破
大型社交新闻和内容分享平台Reddit需要在多个安全维度审核聊天和搜索内容,微调现有模型无法达到所需性能。在使用Amazon Nova Forge将专有领域数据整合到预训练阶段后,首次生产出同时满足准确性和成本效益目标的专属模型,部署和运营更简单,且自然结合了通用语言理解能力和社区特定知识,精准匹配场景需求。
客户案例:Sony Data Ocean的AI转型
Sony基于亚马逊云科技构建Sony Data Ocean,每天处理来自500多个数据源的760TB数据。Sony使用Amazon Bedrock构建企业大语言模型的两年时间里,拥有了57000名用户,每天处理超过15万个推理请求。Sony将Amazon Bedrock AgentCore置于Agentic AI系统中心,能轻松实现管控、部署和管理更有用的Agent能力。通过微调Amazon Nova 2 Lite模型,该模型在参考一致性与文档接地能力上已超越基线模型,其目标是将Sony的合规审查与评估流程效率提升100倍。
04.构建Agent的工具
提供完整系统支持企业级Agent
Amazon Bedrock AgentCore全面增强
Amazon Bedrock AgentCore使企业能够规模化、安全地构建、部署和运营Agent,基于模块化的设计理念,客户可根据自身需求选择相应组件。
AgentCore Policy实时确定性控制的突破
如何在赋予Agent自主性的同时确保可预测行为?AgentCore Policy提供Agent与企业工具和数据交互的实时确定性控制。使用自然语言定义策略,将提示转换为基于自动推理的开源语言的Cedar,部署至AgentCore Gateway,以毫秒级速度评估所有Agent操作。在Agent与所有数据、API和工具之间提供策略评估,确保行为可预测可控。
AgentCore Evaluations持续质量保障
AgentCore Evaluations帮助开发者持续检查基于真实行为的Agent质量。AgentCore Evaluations提供13个预览评估器,覆盖常见质量维度,支持创建自定义评分系统,使用首选提示和模型。在测试阶段评估Agent,在部署前纠正问题,在生产环境中能够快速发现性能降低。




让Agent价值落地
Matt Garman表示,AI Agent能够代表人执行任务并实现工作自动化,这正是AI投资开始产生实质性商业回报的关键节点。AI Agent的出现已将行业推动至AI发展轨迹的拐点——它正从技术奇迹转变为能够创造实际价值的核心生产力工具。
这一变革将对企业业务产生与互联网、云计算同等量级的颠覆性影响,未来每家公司内部有望部署数十亿个Agents,覆盖各类业务场景。目前已能看到Agent在加速医疗健康领域创新、优化客户服务体验、提升薪资处理效率等场景的落地应用,在部分场景中,Agent已成功实现将人类的工作影响力提升十倍。

要真正发挥Agent的价值,企业需要具有全面能力的企业AI工具支持,可重点关注两项关键工具。
01.企业AI工具的全面能力
Amazon Quick企业AI助手实现10倍效率提升
Amazon Quick的目标是为每个员工提供他们在消费级AI中已经开始接受的便捷体验,同时提供企业所需的上下文能力和数据安全性。

Amazon Quick提供三大核心功能,包括丰富的BI(商业智能)能力,能够轻松跨所有结构化和非结构化数据源发现洞察,深度研究功能可调查复杂主题、从内部数据存储库和互联网外部源收集信息并生成详细研究报告,还有Quick Flows能够创建个人小型Agent,自动化日常重复任务并提高个人和团队效率。
Amazon Transform Custom消除技术债务的开创性工具
技术债务每年在美国造成约2.4万亿美元的成本,70%的IT预算用于维护遗留系统。Amazon Transform Custom让客户能够创建自定义代码转换Agent,以现代化任何代码、API、框架或运行时,甚至包括仅在公司内部使用的编程语言或框架。
02.三大前沿Agent开发者工具的开创性突破
改变每个人业务的最大机遇之一就是Agent,它们令人兴奋的核心在于能采取行动、完成任务,还能动态推理并以最佳方式创建工作流程解决问题,无需预先编程。Matt Garman表示前沿Agent具备三大关键特征,即自主性能朝目标前进并自行决定实现方式;大规模可扩展支持单个Agent执行多任务且跨多个实例分配工作;长时运行可连续工作数小时甚至数天无需人工干预。

Kiro Autonomous Agent变革软件开发方式
Kiro Autonomous Agent从根本上改变了软件开发方式。它能与开发流程并行运作,保持上下文理解,自动化完成从功能交付、缺陷分类到提升代码覆盖率等一系列任务。通过与Jira、GitHub、Slack等工具集成,它持续学习团队的工作模式,不断加深对代码、产品及团队标准的理解。
在亚马逊云科技内部实践中,原计划需要30个人18个月的项目,现在6个人在76天内即可完成。
Amazon Security Agent从设计阶段构建安全应用
从设计阶段构建安全应用实现开发提速与安全保障并行,通过提前审查设计文档在编码前预判安全风险,精准识别代码漏洞并集成GitHub拉取请求在开发流中实时反馈,将传统耗时昂贵的渗透测试转为按需实践,既规避安全问题导致的代码重写,无需依赖外部顾问,也支持高频次安全验证。
Amazon DevOps Agent主动预防运维事件
精准解决并主动预防事件,持续提升系统可靠性与性能:仿资深DevOps工程师调查事件、识别运营优化点,从资源、关联关系、现有可观测方案、操作手册、代码库及CI/CD管道中深度学习,关联多源遥测、代码与部署数据。
这些前沿Agent正将AI从技术展示转化为核心生产力工具,助力企业实现10倍效率提升,赋能AI Agent时代新增长。
10分钟硬核发布25项云服务!
重大业务成就见证云计算领导者地位!Matt Garman展示了亚马逊云科技惊人的业务成就:达到1320亿美元规模,同比增长20%(过去12个月增长约220亿美元,超过财富500强一半企业的年收入);Amazon S3存储超过500万亿个对象,每秒处理超过2亿次请求;超过一半的CPU容量来自Amazon Graviton处理器;Amazon Bedrock服务10万家公司,超过50个客户已处理超过1万亿个token;Amazon Bedrock AgentCore SDK下载量超过200万次。
延续亚马逊云科技“构建单元”理念,Matt Garman快速发布了25项云核心服务创新,覆盖计算、存储、数据库等领域。

计算服务创新
存储服务突破
数据库服务升级
其他关键服务
展望Agentic AI时代的无限可能
在演讲的最后,Matt Garman总结道,我们正处于一个前所未有的时代,AI Agent技术将彻底改变企业运营方式。亚马逊云科技通过从芯片到模型到Agent的全栈式创新,为客户提供构建AI Agent所需的四大核心要素:强大且具成本效益的AI基础设施、广泛的模型选择与极高佳性价比的推理系统、让企业数据成为竞争优势的工具、以及完整的Agent构建与管理系统。
配合核心服务的重大创新,亚马逊云科技正在帮助客户获得AI的真正价值。随着数十亿Agents在各行各业运行,企业将实现10倍效率提升,迎接AI Agent时代的无限可能。
好文章,需要你的鼓励
Google DeepMind造出"全能游戏玩家":SIMA 2在虚拟世界里自由行动,还会自己学新技能
牛津大学研究团队发现,经过强化学习训练的AI搜索助手存在严重安全漏洞。通过简单的"搜索攻击"(强制AI先搜索)和"多重搜索攻击"(连续十次搜索),可让AI的拒绝率下降60%,安全性降低超过80%。问题根源在于AI的安全训练与搜索功能训练分离,导致搜索时会生成有害查询。研究呼吁开发安全感知的强化学习方法。
Core Memory播客主持人Ashley Vance近日与OpenAI首席研究官Mark Chen进行了一场长达一个半小时的对话。这是Chen近年来最公开、最深入的一次访谈,话题覆盖人才争夺战、研究战略、AGI时间表,以及他个人的管理哲学。
斯坦福大学团队开发了GuideFlow3D技术,通过创新的引导机制解决3D对象外观转换难题。该方法采用智能分割和双重损失函数,能在保持原始几何形状的同时实现高质量外观转换,在多项评估中显著优于现有方法,为游戏开发、AR应用等领域提供了强大工具。