生成式AI的云上引擎：揭秘Amazon EC2 P5实例原创

Amazon EC2 P5实例则采用8个英伟达H100 Tensor Core GPU，具有640 GB高带宽GPU内存，同时提供第三代AMD EPYC处理器、2TB系统内存和30TB本地NVMe存储。

从2006年南非开普敦一个10人团队开发了亚马逊云科技第一款EC2实例，到现在EC2已经有了600多种实例，几乎覆盖了所有的工作负载。

在这个历程中不得不提Amazon Nitro系统，其开启了软硬件一体化加速产品商业化之路。Amazon Nitro系统不是单一的专用硬件设备，而是一套完整的软硬件融合协同系统，由Nitro虚拟化、Nitro I/O加速卡、Nitro安全芯片三个主要部分组成。

从2013年Amazon Nitro系统问世，亚马逊云科技的自研芯片之路也就此打开，2017年亚马逊云科技发布第三代Amazon Nitro系统，在业界首次使用自研专用芯片。

亚马逊云科技过去10年在自研芯片领域持续创新，形成了三条自研芯片的产品线：第五代虚拟化芯片Amazon Nitro5、三代基于ARM架构的通用处理器芯片Amazon Graviton3及其优化型Amazon Graviton3E、两款用于机器学习的训练和推理的芯片Amazon Trainium和Amazon Inferentia2。

“自研芯片会将节省的成本传递给客户，这在生成式AI中的帮助是巨大的。”亚马逊云科技生成式AI全球副总裁Vasi Philomin说，模型训练的成本很大，如果不降低成本就不会有真正的应用。

为了进一步帮助逐渐增多的生成式AI需求，在纽约峰会上亚马逊云科技也宣布了Amazon EC2 P5实例正式可用，引入了当红炸子鸡H100。

亚马逊云科技和英伟达合作已有12年之久，推出了包括支持视觉计算、人工智能和高性能计算集群的各种GPU实例，如CG1实例（2010年）、G2（2013年）、P2（2016年）、P3（2017年）、G3（2017年）、P3dn（2018年）、G4（2019年）、P4（2020年）、G5（2021年）和P4de（2022年）实例。

去年发布的Amazon EC2 P4de实例采用8个NVIDIA A100 GPU，每个具有80GB高性能的HBM2e GPU 内存，P4de实例适合需要利用由高精度数据组成的大型数据集进行训练的工作负载。

Amazon EC2 P5实例则采用8个英伟达H100 Tensor Core GPU，具有640 GB高带宽GPU内存，同时提供第三代AMD EPYC处理器、2TB系统内存和30TB本地NVMe存储。Amazon EC2 P5实例还提供3200 Gbps的聚合网络带宽并支持GPUDirect RDMA，从而能够绕过CPU进行节点间通信，实现更低的延迟和高效的横向扩展性能。

与上一代基于GPU的实例相比，Amazon EC2 P5实例可以将训练时间缩减6倍（从几天缩短到几小时），从而帮助客户节省高达40%的训练成本。Amazon EC2 P5实例非常适合训练和运行越来越复杂的大语言模型和计算机视觉模型。Vasi谈到，包括像问答、代码生成、视频和图像生成、语音识别等需求。

而且Amazon EC2 P5实例可以部署在超大规模集群第二代Amazon EC2 UltraClusters中，其由高性能计算、网络和云存储组成，Amazon EC2 UltraClusters可以使用多达2万个H100 Tensor Core GPU。

“丰富的EC2实例，可以给客户提供更多性能和价格上的选择，帮助他们更好地进行构建。同时客户在构建一个应用程序的时候，可能并不关心底层架构，更多关心的如何定制属于自己的模型，关系成本效益。”Vasi说道。

随着各种大模型的涌现，企业的算力需求正在井喷式地增长，生成式AI也将成为云服务市场新的增长点，并将推动云服务市场的创新和差异化。

来源：至顶网CIO与CTO频道

0赞

好文章，需要你的鼓励

生成式AI的云上引擎：揭秘Amazon EC2 P5实例 原创

来源：至顶网CIO与CTO频道

2023

08/02

15:37

分享

点赞

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

多站点IT基础设施升级指南：告别VMware的替代方案

戴尔集成Elasticsearch与英伟达Blackwell GPU升级AI数据平台

Confluent Cloud为智能体提供实时数据流处理能力

数字化转型失败的6个警示信号

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

生成式AI的云上引擎：揭秘Amazon EC2 P5实例原创