通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

北京时间12月3日00:00,亚马逊云科技re:Invent 2025进入第二日议程,亚马逊云科技首席执行官Matt Garman重磅发表《亚马逊云科技如何重塑云技术未来》的主题演讲。

北京时间12月3日00:00,亚马逊云科技re:Invent 2025进入第二日议程,亚马逊云科技首席执行官Matt Garman重磅发表《亚马逊云科技如何重塑云技术未来》的主题演讲,系统阐述了构建AI Agent所需的四大核心要素:AI基础设施、推理系统、数据、构建工具,重磅发布开创性的Amazon Nova 2系列基础模型和三大“前沿Agent”(Kiro Autonomous Agent、Amazon Security Agent、Amazon DevOps Agent),并宣布25项云核心服务重大创新,进一步拉大技术代差,巩固亚马逊云科技在全球云计算与AI领域的卓越地位。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

构建AI Agent的四大核心要素

在大会的开始,Matt Garman首先阐释了对AI的趋势理解,他表示,Agentic AI技术正处于关键转折点,从“技术奇迹”转变为能提供实际业务价值的实用工具。他预测未来将有数十亿Agents在各行各业广泛运行,帮助企业实现10倍效率提升,而要让Agent真正发挥作用,需要四大核心要素的坚实支撑。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

01.AI基础设施

提供强大且具成本效益的算力

Amazon Trainium芯片系列突破性进展

Matt Garman宣布正式发布Amazon Trainium 3 UltraServers,这是亚马逊云科技首款搭载3纳米工艺AI芯片的服务器,相较Amazon Trainium 2,不仅计算能力提升4.4倍、内存带宽提升3.9倍,每兆瓦算力可处理的AI token数量更实现了5倍增长。服务器最高配置144个芯片,提供惊人的362 petaflops FP8计算能力。在运行OpenAI的GPT-OSS-120B模型时,每兆瓦输出token数是Amazon Trainium 2的5倍以上,实现超高能耗比。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

更令人振奋的是,Matt Garman首次披露了Amazon Trainium 4芯片,承诺将实现较Amazon Trainium 3六倍的FP4计算性能、四倍内存带宽和两倍高内存容量,持续巩固亚马逊云科技在AI芯片领域的长期领先地位。目前,亚马逊云科技已完成超100万个Trainium 2芯片的规模化部署,为Amazon Bedrock中大部分推理工作提供核心算力支持,包括Claude最新一代模型的高效运行。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

GPU领域的深度合作与创新

亚马逊云科技与NVIDIA合作已达15年,是业界最早在云端提供NVIDIA GPU服务的厂商。Matt Garman特别强调,亚马逊云科技在GPU集群稳定性方面的表现远超行业其他提供商,通过深入细节优化(如调试BIOS预防GPU重启)和对每个问题进行根本原因分析,确保为客户提供业界卓越的GPU运行稳定性。新发布的P6e-GB 300实例搭载NVIDIA最新GB NVL 72系统,为最具挑战性的AI工作负载提供支持。OpenAI在亚马逊云科技上运行ChatGPT,使用数十万芯片的Amazon EC2 Ultra服务器集群,可扩展至超过千万CPU。

Amazon AI Factory突破数据主权限制

受与沙特阿拉伯Neom新创公司合作启发,亚马逊云科技推出开创性的Amazon AI Factory服务。这项服务允许在客户自有数据中心部署亚马逊云科技专用AI基础设施,运行体验与亚马逊云科技公有云区域一致,利用客户现有数据中心空间和电力,访问最新Amazon Trainium UltraServers或NVIDIA GPU,使用Amazon SageMaker和Amazon Bedrock服务,同时满足严格合规和数据主权要求。这为无法将数据迁移到云端的客户提供了完美解决方案。

客户案例:Vialet的科学突破

生物技术公司Vialet利用亚马逊云科技强大的AI基础设施训练“科学多面手”AI,已处理数万亿科学推理token,预计未来几年增长100倍。通过AI自主提出假设、设计并运行实验,Vialet正在加速药物研发和新材料发现,展示了强大AI基础设施如何推动科学突破。

02.推理系统

提供广泛的模型选择与极高性价比

Amazon Bedrock的全面扩展

Amazon Bedrock能够帮助客户快速将生成式AI应用从原型进入到生产环境,它的用户数量比去年同期增长了一倍以上,超过50个客户已处理超过1万亿个token。Amazon Bedrock提供广泛模型选择、基于使用场景定制模型、集成数据工具、添加安全护栏,与亚马逊云科技现有的服务和数据深度集成。

第三方模型体系持续丰富

Matt Garman宣布Amazon Bedrock新增Google Gemma、MiniMax M2、NVIDIA Nemotron、Kimi等开源权重模型。同时提供全新发布的Mistral 3系列,其参数量增加5倍以上、上下文窗口大小是Large 2的两倍,提供从超高效边缘设备到单GPU部署到高级本地的灵活操作。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

Amazon Nova 2系列性价比的突破

亚马逊云科技重磅发布Amazon Nova 2系列,包括四大模型:

  • Amazon Nova 2 Lite:快速、高性价比的推理模型,在指令跟随、工具调用、代码生成、文档信息提取方面表现出色,性能媲美Claude Haiku 4.5、GPT-5 Mini和Gemini 2.5 Flash。
  • Amazon Nova 2 Pro:能够处理高度复杂工作负载的智能推理模型,在指令跟随和智能工具使用方面超越GPT-5.1、Gemini 3 pro等前沿模型。
  • Amazon Nova 2 Sonic:下一代语音到语音模型,提供行业领先对话质量,改进延迟,大幅扩展语言支持。
  • Amazon Nova 2 Omni:业界首个真正统一的多模态模型,支持文本、图像、视频、音频输入,并支持文本和图像输出。Amazon Nova 2 Omni可以理解整个会议内容,包括演讲者的语言、幻灯片、视频等,生成包含文本和图像的摘要。
通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!
通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!
通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!
通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!
通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

客户案例:Greatdeal的内容营销创新

内容营销公司Greatdeal需要在4到6周内,将20多个步骤和多个专业角色由创意转化为创意内容。通过使用Amazon Bedrock和Amazon Nova构建编排Agent,Greatdeal将涉及编辑、设计、网站等不同子Agent组合使用,显著加速内容生产流程,提升工作效率。

03.数据

让企业独有数据成为AI竞争优势

数据与模型集成的挑战

第三方模型无法深度适配企业特定业务数据,且企业专有数据不能嵌入公共可用模型。

Amazon Nova Forge开创性的“开放训练模型”

亚马逊云科技推出开创性的Amazon Nova Forge,引入“开放训练模型”概念。Amazon Nova Forge提供Amazon Nova训练检查点的独家访问,允许在模型训练的每个阶段混合企业专有数据与亚马逊云科技创建的训练数据集,产出的模型能够深度理解企业信息,同时保留核心能力。

该工作流程包括:从80%预训练的Amazon Nova 2 Light检查点开始,混合企业数据与亚马逊云科技训练数据集,使用提供的配方完成预训练,使用远程奖励函数和强化微调进一步改进,最后将模型导入Amazon Bedrock运行推理。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

客户案例:Reddit的内容审核突破

大型社交新闻和内容分享平台Reddit需要在多个安全维度审核聊天和搜索内容,微调现有模型无法达到所需性能。在使用Amazon Nova Forge将专有领域数据整合到预训练阶段后,首次生产出同时满足准确性和成本效益目标的专属模型,部署和运营更简单,且自然结合了通用语言理解能力和社区特定知识,精准匹配场景需求。

客户案例:Sony Data Ocean的AI转型
Sony基于亚马逊云科技构建Sony Data Ocean,每天处理来自500多个数据源的760TB数据。Sony使用Amazon Bedrock构建企业大语言模型的两年时间里,拥有了57000名用户,每天处理超过15万个推理请求。Sony将Amazon Bedrock AgentCore置于Agentic AI系统中心,能轻松实现管控、部署和管理更有用的Agent能力。通过微调Amazon Nova 2 Lite模型,该模型在参考一致性与文档接地能力上已超越基线模型,其目标是将Sony的合规审查与评估流程效率提升100倍。

04.构建Agent的工具

提供完整系统支持企业级Agent

Amazon Bedrock AgentCore全面增强

Amazon Bedrock AgentCore使企业能够规模化、安全地构建、部署和运营Agent,基于模块化的设计理念,客户可根据自身需求选择相应组件。

AgentCore Policy实时确定性控制的突破

如何在赋予Agent自主性的同时确保可预测行为?AgentCore Policy提供Agent与企业工具和数据交互的实时确定性控制。使用自然语言定义策略,将提示转换为基于自动推理的开源语言的Cedar,部署至AgentCore Gateway,以毫秒级速度评估所有Agent操作。在Agent与所有数据、API和工具之间提供策略评估,确保行为可预测可控。

AgentCore Evaluations持续质量保障

AgentCore Evaluations帮助开发者持续检查基于真实行为的Agent质量。AgentCore Evaluations提供13个预览评估器,覆盖常见质量维度,支持创建自定义评分系统,使用首选提示和模型。在测试阶段评估Agent,在部署前纠正问题,在生产环境中能够快速发现性能降低。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!
通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!
通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!
通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

让Agent价值落地

Matt Garman表示,AI Agent能够代表人执行任务并实现工作自动化,这正是AI投资开始产生实质性商业回报的关键节点。AI Agent的出现已将行业推动至AI发展轨迹的拐点——它正从技术奇迹转变为能够创造实际价值的核心生产力工具。

这一变革将对企业业务产生与互联网、云计算同等量级的颠覆性影响,未来每家公司内部有望部署数十亿个Agents,覆盖各类业务场景。目前已能看到Agent在加速医疗健康领域创新、优化客户服务体验、提升薪资处理效率等场景的落地应用,在部分场景中,Agent已成功实现将人类的工作影响力提升十倍。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

要真正发挥Agent的价值,企业需要具有全面能力的企业AI工具支持,可重点关注两项关键工具。

01.企业AI工具的全面能力

Amazon Quick企业AI助手实现10倍效率提升

Amazon Quick的目标是为每个员工提供他们在消费级AI中已经开始接受的便捷体验,同时提供企业所需的上下文能力和数据安全性。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!


Amazon Quick提供三大核心功能,包括丰富的BI(商业智能)能力,能够轻松跨所有结构化和非结构化数据源发现洞察,深度研究功能可调查复杂主题、从内部数据存储库和互联网外部源收集信息并生成详细研究报告,还有Quick Flows能够创建个人小型Agent,自动化日常重复任务并提高个人和团队效率。

Amazon Transform Custom消除技术债务的开创性工具

技术债务每年在美国造成约2.4万亿美元的成本,70%的IT预算用于维护遗留系统。Amazon Transform Custom让客户能够创建自定义代码转换Agent,以现代化任何代码、API、框架或运行时,甚至包括仅在公司内部使用的编程语言或框架。

02.三大前沿Agent开发者工具的开创性突破

改变每个人业务的最大机遇之一就是Agent,它们令人兴奋的核心在于能采取行动、完成任务,还能动态推理并以最佳方式创建工作流程解决问题,无需预先编程。Matt Garman表示前沿Agent具备三大关键特征,即自主性能朝目标前进并自行决定实现方式;大规模可扩展支持单个Agent执行多任务且跨多个实例分配工作;长时运行可连续工作数小时甚至数天无需人工干预。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

Kiro Autonomous Agent变革软件开发方式

Kiro Autonomous Agent从根本上改变了软件开发方式。它能与开发流程并行运作,保持上下文理解,自动化完成从功能交付、缺陷分类到提升代码覆盖率等一系列任务。通过与Jira、GitHub、Slack等工具集成,它持续学习团队的工作模式,不断加深对代码、产品及团队标准的理解。

在亚马逊云科技内部实践中,原计划需要30个人18个月的项目,现在6个人在76天内即可完成。

Amazon Security Agent从设计阶段构建安全应用

从设计阶段构建安全应用实现开发提速与安全保障并行,通过提前审查设计文档在编码前预判安全风险,精准识别代码漏洞并集成GitHub拉取请求在开发流中实时反馈,将传统耗时昂贵的渗透测试转为按需实践,既规避安全问题导致的代码重写,无需依赖外部顾问,也支持高频次安全验证。

Amazon DevOps Agent主动预防运维事件

精准解决并主动预防事件,持续提升系统可靠性与性能:仿资深DevOps工程师调查事件、识别运营优化点,从资源、关联关系、现有可观测方案、操作手册、代码库及CI/CD管道中深度学习,关联多源遥测、代码与部署数据。

这些前沿Agent正将AI从技术展示转化为核心生产力工具,助力企业实现10倍效率提升,赋能AI Agent时代新增长。

10分钟硬核发布25项云服务!

重大业务成就见证云计算领导者地位!Matt Garman展示了亚马逊云科技惊人的业务成就:达到1320亿美元规模,同比增长20%(过去12个月增长约220亿美元,超过财富500强一半企业的年收入);Amazon S3存储超过500万亿个对象,每秒处理超过2亿次请求;超过一半的CPU容量来自Amazon Graviton处理器;Amazon Bedrock服务10万家公司,超过50个客户已处理超过1万亿个token;Amazon Bedrock AgentCore SDK下载量超过200万次。

延续亚马逊云科技“构建单元”理念,Matt Garman快速发布了25项云核心服务创新,覆盖计算、存储、数据库等领域。

通往数十亿Agents的未来!re:Invent 2025 Matt Garman主题演讲精华!

计算服务创新

  • X系列大内存实例搭载定制Intel Xeon 6处理器,提供50%更多内存,适用于SAP HANA、SQL Server、EDA应用。
  • C8a实例基于最新AMD EPYC处理器,性能提升30%,适用于批处理、游戏等CPU密集型应用。
  • C8ine实例搭载定制Intel Xeon 6处理器,使用最新Nitro V6卡,每vCPU提供2.5倍更高的数据包处理性能,适用于安全和网络应用。
  • M8azn实例拥有亚马逊云科技实例中最高CPU时钟频率,适用于多人游戏、高频交易、实时数据分析。
  • EC2 M3 Ultra Mac和M4 Max Mac实例搭载最新Apple硬件,用于构建、测试、签名Apple应用。
  • Lambda durable functions允许在Lambda函数中直接编程等待时间,管理状态、构建长时间运行的工作负载,内置错误处理和自动恢复。

存储服务突破

  • Amazon S3对象大小上限从5TB增加到50TB(增加10倍),适用于处理超大的数据文件。
  • Amazon S3批处理操作速度提升10倍。
  • Amazon S3表格智能分层为S3表格存储桶中的数据,自动节省高达80%存储成本。
  • Amazon S3表格跨区域复制自动复制S3表格到其他亚马逊云科技区域和账户,确保从任何地方获得一致的查询性能。
  • Amazon S3访问点支持FSx for NetApp ONTAP,扩展S3访问点以包括NetApp ONTAP支持,让NetApp客户能像访问S3一样无缝访问数据。
  • Amazon S3向量正式发布,原生支持存储和查询向量的云对象存储,在单个S3桶中存储万亿级向量,降低存储和查询成本90%。
  • Amazon OpenSearch向量索引GPU加速,使用GPU索引数据,速度提升10倍,成本降低至1/4。

数据库服务升级

  • Amazon RDS for SQL Server和Oracle存储容量从64TB增加到256TB,I/OPS和IO带宽提升4倍,更易迁移现有工作负载并在亚马逊云科技上扩展。
  • Amazon SQL Server数据库实例可指定vCPU数量,帮助减少来自Microsoft的每CPU许可成本。
  • 支持Amazon SQL Server开发者版本,无许可费构建和测试应用。
  • Database Savings Plans在所有数据库服务使用中节省高达35%。

其他关键服务

  • Amazon EMR Serverless无需预置本地存储,消除为Amazon EMR Serverless集群预置和管理本地存储的需要。
  • Amazon GuardDuty扩展威胁检测支持Amazon ECS,将先进威胁检测能力扩展到ECS容器,所有GuardDuty客户无需额外成本即可使用。
  • Amazon Security Hub正式发布,新增功能包括近实时风险分析、趋势仪表板、简化定价模型。
  • CloudWatch统一数据存储用于所有操作、安全和合规数据,自动从亚马逊云科技和第三方收集日志数据,存储在Amazon S3或S3表格中,便于查找问题和获取见解。

展望Agentic AI时代的无限可能

在演讲的最后,Matt Garman总结道,我们正处于一个前所未有的时代,AI Agent技术将彻底改变企业运营方式。亚马逊云科技通过从芯片到模型到Agent的全栈式创新,为客户提供构建AI Agent所需的四大核心要素:强大且具成本效益的AI基础设施、广泛的模型选择与极高佳性价比的推理系统、让企业数据成为竞争优势的工具、以及完整的Agent构建与管理系统。

配合核心服务的重大创新,亚马逊云科技正在帮助客户获得AI的真正价值。随着数十亿Agents在各行各业运行,企业将实现10倍效率提升,迎接AI Agent时代的无限可能。

来源:业界供稿

0赞

好文章,需要你的鼓励

2025

12/08

14:57

分享

点赞

邮件订阅