自从参加今年纽约Summit后,我就深刻感受到生成式AI已经成为亚马逊云科技发展的首要任务,并且通过生成式AI,亚马逊云科技正在重新思考IT基础设施。
今年re:Invent在生成式AI上又下一城,其实早些时候,亚马逊云科技就已经建立起三个层级的全栈生成式AI能力,最底层是训练和推理的基础设施层,中间层是微调模型需求的工具服务,上层是构建生成式AI的应用层。
亚马逊云科技大中华区产品部总经理陈晓建说,亚马逊云科技在生成式AI的端到端的3个不同层面展开持续投入,并且不断解决定制化能力问题,因为没有一个现成的基础模型是能够去直接应用到各行各业的生产环境里的,大模型需要和业务数据进行结合产生效果。
全栈生成式AI能力再进化
在生成式AI上,亚马逊云科技在底层提供一些用于训练基础模型和在生产中运行这些模型的基础设施;中间层提供了访问基础模型的最便捷的方式,让没有AI经验的构建者,直接获得应用生成式人工智能所需的所有工具,来构建自己的应用;在顶层有利用基础模型构建的开箱即用的应用程序,让没有技术基础的业务用户,也能在具体场景中直接使用生成式AI。
底层,亚马逊云科技在13年前就看到了GPU这种加速计算芯片的价值,所以也是第一个把GPU带入到云上的云供应商,在Amazon EC2 P3的实例中率先提供了NVIDIA V100 GPU。
亚马逊云科技是全球第一家将NVIDIA最新的芯片H100 GPU和Amazon EC2 P5实例推出市场的主要云提供商,Amazon EC2 P5实例在训练上比Amazon EC2 P4实例要快4倍,而成本只是Amazon EC2 P4的60%。
今年re:Invent,亚马逊云科技CEO Adam携手英伟达CEO黄仁勋扩大战略合作,亚马逊云科技成为首家推出NVIDIA GH200 NVL32实例的云厂商,并且开展“Project Ceiba”合作项目,将全球最快的GPU驱动AI超级计算机和NVIDIA DGX云超级计算机用于NVIDIA AI的训练、研发、定制化模型的开发,它将拥有1.6万个最新的GH200超级芯片,提供高达65 ExaFLOPS的惊人算力。
亚马逊云科技还推出了专为训练人工智能系统而设计的第二代芯片Amazon Trainium2,相较 Amazon Trainium性能提升了4 倍,针对于数千亿甚至数万亿参数的大模型训练做了特别的调优。
中间层,自今年4月Amazon Bedrock发布以来就备受关注,re:Invent上,Amazon Bedrock也对两个模型进行了升级,支持Anthropic Claude 2.1和Meta LLaMa 2 70B。并发布了模型的微调、检索增强生成,以及基于Amazon Titan大模型的预训练功能。
另外Agents for Amazon Bedrock也正式可用,它能够理解用户请求,将复杂任务分解为多个步骤,而且是自动和托管的。
应用层,Amazon Q也是一个情理之中,意料之外的发布,市面上我们可以看到很多智能助手,Amazon Q则是业界第一个专门针对企业业务场景,可以量身定制的生成式AI助手,基于企业内部数据帮助企业解决问题。
Amazon Q这个助手可以是用户在亚马逊云科技上构建、部署和操作应用程序及工作负载的专家,通过自然语言问答形式,帮助开发人员快速找到想要的服务;可以是用户的业务专家,连接企业的数据,安全且私密地为业务问题提供快速、准确且相关的答案;可以是商业智能专家,支持将其引入多种服务和应用中以提供基于生成式AI的帮助;可以是联络中心专家,引入云联络中心应用Amazon Connect中。而且Amazon Q也将为即将推出的Amazon Supply Chain提供生成式AI助手。
“Amazon Q首先具有专业能力,而且提供了定制化的能力,可以让用户实现自己的定制化,最后是最大限度地保证安全。”陈晓建认为这只是一个开始,未来越来越多的产品会集成Amazon Q的能力,
Amazon Q会带来一个ChatBot聊天式助理的新的用户体验,是对其他产品的一个补充。开发者环节可能是Amazon Q最先应用的场景,像几天之内能够把一千多个JAVA的应用从JAVA8升级到JAVA17,另外还有知识库和商业智能领域也是能快速落地的场景。
从云到边的技术再演进
在AI服务的大量创新之外,亚马逊云科技在基础设施上也在不断投入,目前已横跨世界32个地理区域,并宣布计划新增5个左右的区域。而且今天亚马逊云科技的数据中心数量比第二大的云提供商多三倍,服务多60%,功能多40%。
我们都知道,全球第一款云服务是Amazon S3,Amazon S3提供目前从S3 Standard到S3 Glacier Deep Archive丰富多样的存储层级。亚马逊云科技也看到一些非常挑战的场景需要高性能分析处理的金融交易分析、欺诈检测、基于机器学习的量化交易等,这需要在几分钟之内访问数百万次存储的请求,并且它的延时需要保持在数毫秒的级别。
re:Invent发布了当前云中最快的对象存储服务Amazon S3 Express One Zone,它使用的是一个全新架构的Amazon S3的存储类别,采用专门设计的软硬件来加速数据处理,能够将存储访问的数据和高性能的计算应用就近部署。可提供比Amazon S3标准存储快10倍的性能,同时能够以一致的毫秒级延迟处理每分钟数百万次的请求,同时请求成本降低了50%。
通用芯片上,在2018年亚马逊云科技就推出了业界第一款自研的通用芯片Amazon Graviton,迄今为止已经发布了三代半。Amazon Graviton处理器基于ARM架构,re:Invent上亚马逊云科技推出Graviton的最新一代Graviton4,与当前一代Graviton3处理器相比,Graviton4性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上,基于Graviton4的Amazon EC2 R8g实例目前已提供预览。
并且基于Amazon Graviton3处理器的Amazon Elastic Compute Cloud(Amazon EC2)M7g通用型、C7g计算优化型和R7g内存优化型三款实例已经在15日落地中国。
亚马逊云科技是第一家在业界推出Serverless服务的云提供商,去年亚马逊云科技也成为首个数据分析服务全部实现Serverless的云供应商,今年,亚马逊云科技高级副总裁Peter又宣布了3项数据库和应用领域的Serverless创新。
Amazon Aurora Limitless Database是唯一一个真正使用无服务器化来实现的分片数据库,用户将不用再手动管理底层的物理服务器资源,Serverless可以自动实现资源的管理和扩缩容,同时按需付费,来最大限度帮用户降低成本。Amazon ElastiCache Serverless可以帮助客户在一分钟内创建高可用的缓存,并实时进行垂直和水平扩展以支持客户复杂的应用程序,且无需管理基础架构。Amazon Redshift Serverless新的基于AI的扩展和优化功能的预览,可根据多个工作负载维度自动调整资源并执行优化操作以完成预设的性价比目标。
亚马逊云科技还通过Amazon Local Zone、Amazon Outposts、Amazon Snowball、Amazon Private 5G等服务,来把云从中心拓展到边缘,并且还通过Amazon Ground Station加速卫星数据上云,把云计算带入太空。
同时“Kuiper计划”也是亚马逊云科技正在建设的一个项目,通过数千颗近地轨道卫星组成卫星网络,为地球上数亿个缺乏可靠的互联网连接的人们提供更加快捷、可靠的宽带服务,缩小数字鸿沟。
好文章,需要你的鼓励
数据连接器构建商Airbyte发布更新,数据传输速度提升95%,成本降低显著。Snowflake同步速度提升10倍,MySQL到S3传输速度从23MB/s增至110MB/s。Assured Data Protection推出基于Zerto的灾难恢复服务。Snowflake Ventures投资Ataccama。Ceph发布V20.2版本。多家存储厂商包括NetApp、Qumulo、Veeam等发布产品更新和人事任命。中国存储领域仍面临硬盘驱动器技术挑战。
Meta与华盛顿大学联合研究团队开发出无需人类标注的AI评判官自我训练框架。该方法通过生成合成对比数据、自我判断筛选和反复学习,使110亿参数的AI评判官在多项视觉语言任务中超越GPT-4o等大型模型,成本仅为传统方法的1%,为AI自主学习和评估开辟新路径。
Qumulo将其横向扩展文件系统移植到Google Cloud平台,在Google Cloud市场推出Cloud Native Qumulo服务。该方案支持EB级扩展和全面的文件及对象应用,可实现1.6TBps吞吐量和2000万IOPS性能。用户只需为实际使用的容量和性能付费,通过机器学习优化读写操作,最多可降低99%的云I/O成本,10分钟内即可部署完整的文件数据平台。
华中科技大学团队开发出4DLangVGGT技术,首次实现AI系统对4D动态场景的语言理解。该技术突破传统方法需要逐场景训练的限制,能跨场景通用部署。系统结合几何感知和语义理解,不仅能识别物体还能描述其时间变化过程。实验显示在多项指标上超越现有方法1-2%,为机器人、AR/VR、智能监控等领域提供重要技术支撑。