从2006年南非开普敦一个10人团队开发了亚马逊云科技第一款EC2实例,到现在EC2已经有了600多种实例,几乎覆盖了所有的工作负载。
在这个历程中不得不提Amazon Nitro系统,其开启了软硬件一体化加速产品商业化之路。Amazon Nitro系统不是单一的专用硬件设备,而是一套完整的软硬件融合协同系统,由Nitro虚拟化、Nitro I/O加速卡、Nitro安全芯片三个主要部分组成。
从2013年Amazon Nitro系统问世,亚马逊云科技的自研芯片之路也就此打开,2017年亚马逊云科技发布第三代Amazon Nitro系统,在业界首次使用自研专用芯片。
亚马逊云科技过去10年在自研芯片领域持续创新,形成了三条自研芯片的产品线:第五代虚拟化芯片Amazon Nitro5、三代基于ARM架构的通用处理器芯片Amazon Graviton3及其优化型Amazon Graviton3E、两款用于机器学习的训练和推理的芯片Amazon Trainium和Amazon Inferentia2。
“自研芯片会将节省的成本传递给客户,这在生成式AI中的帮助是巨大的。”亚马逊云科技生成式AI全球副总裁Vasi Philomin说,模型训练的成本很大,如果不降低成本就不会有真正的应用。
为了进一步帮助逐渐增多的生成式AI需求,在纽约峰会上亚马逊云科技也宣布了Amazon EC2 P5实例正式可用,引入了当红炸子鸡H100。
亚马逊云科技和英伟达合作已有12年之久,推出了包括支持视觉计算、人工智能和高性能计算集群的各种GPU实例,如CG1实例(2010年)、G2(2013年)、P2(2016年)、P3(2017年)、G3(2017年)、P3dn(2018年)、G4(2019年)、P4(2020年)、G5(2021年)和P4de(2022年)实例。
去年发布的Amazon EC2 P4de实例采用8个NVIDIA A100 GPU,每个具有80GB高性能的HBM2e GPU 内存,P4de实例适合需要利用由高精度数据组成的大型数据集进行训练的工作负载。
Amazon EC2 P5实例则采用8个英伟达H100 Tensor Core GPU,具有640 GB高带宽GPU内存,同时提供第三代AMD EPYC处理器、2TB系统内存和30TB本地NVMe存储。Amazon EC2 P5实例还提供3200 Gbps的聚合网络带宽并支持GPUDirect RDMA,从而能够绕过CPU进行节点间通信,实现更低的延迟和高效的横向扩展性能。
与上一代基于GPU的实例相比,Amazon EC2 P5实例可以将训练时间缩减6倍(从几天缩短到几小时),从而帮助客户节省高达40%的训练成本。Amazon EC2 P5实例非常适合训练和运行越来越复杂的大语言模型和计算机视觉模型。Vasi谈到,包括像问答、代码生成、视频和图像生成、语音识别等需求。
而且Amazon EC2 P5实例可以部署在超大规模集群第二代Amazon EC2 UltraClusters中,其由高性能计算、网络和云存储组成,Amazon EC2 UltraClusters可以使用多达2万个H100 Tensor Core GPU。
“丰富的EC2实例,可以给客户提供更多性能和价格上的选择,帮助他们更好地进行构建。同时客户在构建一个应用程序的时候,可能并不关心底层架构,更多关心的如何定制属于自己的模型,关系成本效益。”Vasi说道。
随着各种大模型的涌现,企业的算力需求正在井喷式地增长,生成式AI也将成为云服务市场新的增长点,并将推动云服务市场的创新和差异化。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。