Trainium3+Graviton5打出组合拳，Lambda迈入可控时代原创

作者：王聪彬

re:Invent第三天披露了更多AWS Trainium 3与Amazon EC2 Trn3 UltraServers的技术细节，并且新一代AWS Graviton5也如期而至。

亚马逊云科技公用计算高级副总裁Peter DeSantis今年形象大变，直接成为精神小伙。

亚马逊云科技公用计算高级副总裁Peter DeSantis

今天re:Invent的发布毫无悬念，主要围绕AWS Trainium3和AWS Graviton5展开，当然还有老朋友Apple（苹果）。

AWS Trainium 3和Amazon EC2 Trn3 UltraServers在第一天就已经发布，Peter DeSantis也做了更多细节披露。

Amazon EC2 Trn3 UltraServers单机配备144块AWS Trainium 3芯片，提供362 PFlops的FP8性能和706 TB/s带宽。相比之下，上一代Amazon EC2 Trn2 UltraServers仅搭载64块Trainium 2芯片，性能为83.2PFlops、6 TB HBM，以及184 TB/s带宽。

展区也展示了1U的Amazon EC2 Trn3 UltraServers计算节点，其中搭载了4块AWS Trainium 3芯片。

同时还做了非常多的微架构优化，每兆瓦生成的Token数量是Amazon EC2 Trn2 UltraServers的五倍。

通用计算同样在加速演进，2018年发布第一款AWS Graviton，如今已经来到AWS Graviton5，其采用192核设计，并将缓存容量提升至前代的5倍，显著缩短核心间的数据传输路径，使通信延迟最高降低33%，带宽同步提升。

同时，AWS Graviton5配备了提升5倍容量的L3缓存，每个核心可访问的L3缓存容量达到 AWS Graviton4的2.6 倍，为高并发与内存密集型负载提供了更强的支撑。

基于AWS Graviton5的新实例Amazon EC2 M9g instances比上一代产品性能提升高达25%。

亚马逊云科技计算与机器学习服务副总裁Dave Brown展示了一些早期用户的使用数据：airbnb最高可提升25%性能；Atlassian相比前代产品，性能提升30%，延迟降低20%；Honeycomb.io相比AWS Graviton4最高可降低25%延迟，每核性能提升36%；SAP单代性能最高提升60%。

去年，Apple强调的是在AI与ML生命周期的许多阶段采用亚马逊云科技服务，从微调模型到优化和构建可供部署的最终适配器，扩展了Apple培训基础设施以满足创新需求。同时，Apple也分享了其从x86和G4实例迁移至Graviton与Inferentia2的实践。

今年苹果云系统与平台副总裁Payam Mirrashidi重点谈的是Graviton的迁移效果，核心服务以Swift重构并全面迁移至Graviton之后，Apple实现了40%的性能提升和30%的成本下降。

目前亚马逊云科技连续第三年，新增CPU容量的一半以上由Graviton提供支持，排名前1000 的EC2客户中有98%已经受益于 Graviton 的性价比优势，包括Adobe、Airbnb、Atlassian、Epic Games、F1、Pinterest、SAP、Siemens、Snowflake和Synopsys。

苹果云系统与平台副总裁Payam Mirrashidi

最后值得一提的是今年推出的AWS Lambda Managed Instances。自2014年问世以来，AWS Lambda一直被视为亚马逊乃至整个科技史上最具颠覆性的服务之一，目前全球每月的调用量已达到约15万亿次。

AWS Lambda Managed Instances允许在Amazon EC2上运行AWS Lambda函数，同时继续保留无服务器架构所带来的运维简化体验。实现在不牺牲熟悉的无服务器开发体验的前提下，获取更丰富的计算选项，并为稳定运行的工作负载优化成本。

亚马逊云科技Bedrock产品经理Atul Deo介绍说，以往在Lambda中，容量与吞吐完全由系统托管，开发者只需写代码，看不到背后的实例形态。如今通过Lambda Managed Instances，客户可以自主选择一系列EC2实例类型，用来承载自己的无服务器函数，实现“保持无服务器体验，同时获得可选算力”的新模式。

这让客户在获得更多底层控制权的同时，保留了Lambda的所有核心好处：运维简单、按事件驱动、无须自己操心打补丁、系统升级、运行时更新等。

同时Atul Deo也观察到，Serverless技术正在各类Agent场景被大量使用。Agent 既需要安全、隔离的运行时环境，也依赖在大量事件驱动的场景中灵活扩缩，这正是Lambda这种 Serverless服务天生的优势。

在生成式AI时代，很多步骤恰好适合用 Lambda 函数来承载。涉及大量的状态管理和事件编排，需要在保证性能和可靠性的前提下，把整个工作流控制在一个成本可控、性价比高的水平上。

在生成式AI的工作流里，许多环节天然适合交由Lambda函数来承载，大量状态管理、事件驱动的编排、对性能与可靠性的持续要求，都需要一种足够弹性、又具备成本效率的底层架构。

随着更多企业把复杂的AI推向生产环境，如何在算力和成本之间找到新的平衡点，将愈发依赖这种“按需即用”的计算范式。

来源：至顶网CIO与CTO频道

0赞

好文章，需要你的鼓励

Trainium3+Graviton5打出组合拳，Lambda迈入可控时代 原创

来源：至顶网CIO与CTO频道

2025

12/05

06:48

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Agentic AI军备竞赛升级！亚马逊云科技亮出“底牌”，定义下一条赛道

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

汇丰PayMe成功迁移至亚马逊云科技 加速推动香港电子支付创新

亚马逊云科技与OpenAI宣布达成多年战略合作

亚马逊云科技的“AI毛坯房”，能解决游戏出海80%需求吗？

亚马逊云科技第三期创业加速器圆满收官 助力初创释放Agentic AI潜力 加速全球化进程

AI革新制造业：产品力、品牌力与精益运营的三维进化论

更多“厨师”、更快“出餐”：Graviton4的性价比账单

PayerMax想用AI重构跨境支付的“水电煤”

跨境卖家突围，Pacvue泊客电商的AI全链路运营攻略

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Trainium3+Graviton5打出组合拳，Lambda迈入可控时代原创

打造Token极致性价比新华三震撼亮相2026世界人工智能大会

汇丰PayMe成功迁移至亚马逊云科技加速推动香港电子支付创新

亚马逊云科技第三期创业加速器圆满收官助力初创释放Agentic AI潜力加速全球化进程