2018年,Amazon Graviton在云计算舞台上首次亮相,亚马逊云科技发布了首代基于Arm架构的芯片。六年后的2024年,Graviton4在re:Invent上登场,性能和能效实现大幅提升。一年后的今天,基于Graviton4处理器的Amazon EC2 C8g、M8g和R8g实例正式落地中国。
每一次Amazon Graviton的升级,都带来了两位数的性能提升,同时单位算力的功耗也在持续下降,这也预示着我们也正在迈入新一轮高效算力时代。
Amazon Graviton的诞生,源于性价比
亚马逊云科技自研芯片的原因已经阐述过多次,Amazon Graviton的诞生正是为了回应客户的“双重需求”:一方面追求更高性能,另一方面希望成本更低。
Amazon Graviton作为云原生芯片,其优势主要体现在四个方面:第一,云讲究规模经济,在客户量大、用量高的情况下,自研芯片能够有效降低成本;第二,去除服务器上不必要的工作负载支持,实现提高能效、降低功耗;第三,可针对特定工作负载进行定制优化;第四,通过循环迭代,不断吸收上一代使用反馈,在加密计算、浮点运算、内存性能等方面实现持续提升。
亚马逊云科技自身的基础设施也在大规模采用Graviton,现在全球机房里新上线的服务器里,大于50%都采用了Amazon Graviton,在数量级上超过了x86。
基于Amazon Graviton,亚马逊云科技推出了多种EC2实例。自Graviton2起,为了更好的识别,所有相关实例都加上“g”后缀。目前,全球范围内基于Amazon Graviton的Amazon EC2实例已超过200种,几乎所有Amazon EC2前100大客户都在使用这些实例。
为了让客户可以获得最优的算力性价比,亚马逊云科技进一步将客户常用的托管服务运行在Amazon Graviton之上,包括Amazon Relational Database Service、Amazon Aurora、Amazon ElastiCache、Amazon MemoryDB for Redis、Amazon OpenSearch、Amazon EMR、Amazon Elastic Kubernetes Service和Amazon Lambda等托管服务。仅需几分钟就可将托管服务转移到Amazon Graviton实例上,实现高达40%的性价比提升。
“从工作负载来看,数据库和分析型应用的迁移速度最快,占比接近一半,而且用户一旦迁移成功几乎不会回退。”亚马逊云科技大中华区产品总监张洋说道。容器化和微服务工作负载覆盖了客户应用的三分之一到一半,呈现出稳定的增长趋势。
此外,在搜索推荐和广告等传统机器学习工作负载上,Amazon Graviton的性能普遍提升在35%至50%。少数客户出于成本优化和管理一致性的考虑,也会将其用于推理任务。
从技术特性,看芯片优化全景
Amazon Graviton如何实现如此突出的性价比?纵观四代芯片,Graviton4芯片面积显著增大,在设计上采用7芯片模块架构,核心数也从64个Neoverse V2提升至96个,实现了50%的增长。
重点优化是每个核心配备的二级缓存从1MB提高到2MB。张洋特别强调,增加一级缓存会延长指令周期,增加三级缓存则在指标上看似亮眼,但在成本和性能收益之间并不划算。相比之下,二级缓存的扩展能在性能与成本间实现最佳平衡,是最具性价比的优化路径。
在芯片这个“中央厨房”中,核心数量增加,就相当有了更多的厨师,就需要更快地把“数据”食材运送上来。Graviton4配备了12个DDR5-5600内存通道,相比上一代的5200MT/s,带宽提升了75%,大幅增强了数据吞吐能力。
除了单芯片优化,Graviton4在纵向扩展上也有显著提升。支持双路CPU,单路96核,双路192核,核心数较Graviton3提升50%,规模已接近Intel的最大实例。
为充分发挥双CPU算力,Graviton4还采用了多插槽一致性架构,两颗CPU通过CCIX互联,实现高速缓存一致性,保障大规模计算的性能与效率。张洋指出,该架构最大可支持至48xLarge实例,并结合Nitro控制层灵活管理资源,192核心既可整体分配给单个用户,也可虚拟化拆分成两台实例,分配给不同用户使用,实现高效且灵活的算力调度。
最后也是最重要的安全性,Graviton4实现了端到端加密,从芯片的数据处理,到内存之间的传输,再到主板信号通道,每一个环节都配备加密机制,全面保障客户使用的安全性。
从设计开始,一路践行“逆向工作法”
亚马逊云科技在产品开发中一直采用“逆向工作法”,即先洞察需求,再打造相应工具。在Graviton的设计中,这一方法同样贯穿始终:从客户的真实应用出发,分析使用特征,并将反馈直接应用于芯片优化,确保贴合实际使用场景。
为了验证优化效果,亚马逊云科技对Graviton4进行了从基准测试到实际工作负载的全方位测试。比如前端应用(如Nginx)与后端数据库(如MySQL)对缓存和指令周期的敏感点不同,常规基准测试可能突出三级缓存的优势,但实际应用中更看重一级、二级缓存的延迟。
通过对比Graviton3和Graviton4在MySQL上的表现可以明显看到优化成果,在单指令层性能相近的情况下,二级缓存的优化使数据缓存延迟从0.4降低至0.1以内。
在实际工作负载测试中,Graviton4在后端停滞指标高于Graviton3,这恰恰反映了二级缓存的优化效果。前端CPU部分的二级缓存指令逻辑和分支预测都有显著改进,而分支预测与数据库数据结构(如二叉树)密切相关,所以Graviton4在数据库类工作负载上能够带来显著性能提升。
张洋解释称,这些优化正是逆向工作法的成果体现:先从第一批数据库客户观察数据特性,再将这些特性反馈到芯片设计中。新芯片发布后,客户便能直接受益。帮助数据密集型工作负载,例如Redis、MySQL、MongoDB,Graviton4的整体性能提升非常明显。
迈出第一步的人,已率先获益
对客户而言,性价比与性能始终是决定是否迁移至Amazon Graviton的关键因素。实际测试显示,不少客户可在成本上节省了20%;金融、游戏等对用户体验要求极高的行业,性能表现更被优先考量。张洋强调,迁移过程本质上是一种权衡,只有当性能与成本优势能够抵消人力投入和切换风险时,才会选择迁移。
早在2021年的亚马逊Prime Day,12个核心零售服务中就已经部署了超过5.3万个基于Graviton2的C6g实例,构建起跨三个可用区的集群。到2025年,亚马逊Prime Day期间所使用的Amazon EC2实例中,已有超过40%运行在Amazon Graviton之上。
目前,全球前100大客户中,Graviton的使用率已达100%;前200和前1000大客户中,也均有约95%在使用。整体来看,客户的迁移趋势非常明确,虽然并非所有工作负载都迁移至Amazon Graviton,但每年的增长速度已远超x86。
在实际客户应用中,Graviton4的表现同样获得验证。Epic Games的游戏《堡垒之夜》在部署后反馈,R8g实例是他们“测试过的最快的 EC2 实例”。IBM完成Graviton3迁移后,CPU 利用率下降 35%,成本减少了18%。在Graviton4的实例上运行SAP HANA Cloud,分析型工作负载性能提升了25%,事务型工作负载性能提升更是达到40%。
张洋观察到,许多客户并非逐代升级,而是采取“跳跃式”策略,可能从Graviton2直接迁移到Graviton4,达到最大化价值收益。
当然还有不少客户会担心迈出第一步的难度,因此亚马逊云科技也建立了合作伙伴生态。SI(系统集成商)能够帮助客户完成系统改造,亚马逊云科技服务团队则以outcome-based 的模式帮助客户优化;ISV伙伴,比如TiDB、StarRocks、Docker、Elastic、Datadog、Databricks 等也已完成 Amazon Graviton适配,让更多客户能够无缝上手。
如今,采用 Amazon Graviton 的客户在日常业务中,间接享受到其带来的性能与性价比优势。而这也并非迁移的终点,而是算力创新的全新起点。
好文章,需要你的鼓励
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1,建议所有用户安装。由于重大版本发布通常伴随漏洞,许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试,但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布,测试范围此前受限。预计苹果将继续发布后续修复版本。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。