自从参加今年纽约Summit后,我就深刻感受到生成式AI已经成为亚马逊云科技发展的首要任务,并且通过生成式AI,亚马逊云科技正在重新思考IT基础设施。
今年re:Invent在生成式AI上又下一城,其实早些时候,亚马逊云科技就已经建立起三个层级的全栈生成式AI能力,最底层是训练和推理的基础设施层,中间层是微调模型需求的工具服务,上层是构建生成式AI的应用层。
亚马逊云科技大中华区产品部总经理陈晓建说,亚马逊云科技在生成式AI的端到端的3个不同层面展开持续投入,并且不断解决定制化能力问题,因为没有一个现成的基础模型是能够去直接应用到各行各业的生产环境里的,大模型需要和业务数据进行结合产生效果。
全栈生成式AI能力再进化
在生成式AI上,亚马逊云科技在底层提供一些用于训练基础模型和在生产中运行这些模型的基础设施;中间层提供了访问基础模型的最便捷的方式,让没有AI经验的构建者,直接获得应用生成式人工智能所需的所有工具,来构建自己的应用;在顶层有利用基础模型构建的开箱即用的应用程序,让没有技术基础的业务用户,也能在具体场景中直接使用生成式AI。
底层,亚马逊云科技在13年前就看到了GPU这种加速计算芯片的价值,所以也是第一个把GPU带入到云上的云供应商,在Amazon EC2 P3的实例中率先提供了NVIDIA V100 GPU。
亚马逊云科技是全球第一家将NVIDIA最新的芯片H100 GPU和Amazon EC2 P5实例推出市场的主要云提供商,Amazon EC2 P5实例在训练上比Amazon EC2 P4实例要快4倍,而成本只是Amazon EC2 P4的60%。
今年re:Invent,亚马逊云科技CEO Adam携手英伟达CEO黄仁勋扩大战略合作,亚马逊云科技成为首家推出NVIDIA GH200 NVL32实例的云厂商,并且开展“Project Ceiba”合作项目,将全球最快的GPU驱动AI超级计算机和NVIDIA DGX云超级计算机用于NVIDIA AI的训练、研发、定制化模型的开发,它将拥有1.6万个最新的GH200超级芯片,提供高达65 ExaFLOPS的惊人算力。
亚马逊云科技还推出了专为训练人工智能系统而设计的第二代芯片Amazon Trainium2,相较 Amazon Trainium性能提升了4 倍,针对于数千亿甚至数万亿参数的大模型训练做了特别的调优。
中间层,自今年4月Amazon Bedrock发布以来就备受关注,re:Invent上,Amazon Bedrock也对两个模型进行了升级,支持Anthropic Claude 2.1和Meta LLaMa 2 70B。并发布了模型的微调、检索增强生成,以及基于Amazon Titan大模型的预训练功能。
另外Agents for Amazon Bedrock也正式可用,它能够理解用户请求,将复杂任务分解为多个步骤,而且是自动和托管的。
应用层,Amazon Q也是一个情理之中,意料之外的发布,市面上我们可以看到很多智能助手,Amazon Q则是业界第一个专门针对企业业务场景,可以量身定制的生成式AI助手,基于企业内部数据帮助企业解决问题。
Amazon Q这个助手可以是用户在亚马逊云科技上构建、部署和操作应用程序及工作负载的专家,通过自然语言问答形式,帮助开发人员快速找到想要的服务;可以是用户的业务专家,连接企业的数据,安全且私密地为业务问题提供快速、准确且相关的答案;可以是商业智能专家,支持将其引入多种服务和应用中以提供基于生成式AI的帮助;可以是联络中心专家,引入云联络中心应用Amazon Connect中。而且Amazon Q也将为即将推出的Amazon Supply Chain提供生成式AI助手。
“Amazon Q首先具有专业能力,而且提供了定制化的能力,可以让用户实现自己的定制化,最后是最大限度地保证安全。”陈晓建认为这只是一个开始,未来越来越多的产品会集成Amazon Q的能力,
Amazon Q会带来一个ChatBot聊天式助理的新的用户体验,是对其他产品的一个补充。开发者环节可能是Amazon Q最先应用的场景,像几天之内能够把一千多个JAVA的应用从JAVA8升级到JAVA17,另外还有知识库和商业智能领域也是能快速落地的场景。
从云到边的技术再演进
在AI服务的大量创新之外,亚马逊云科技在基础设施上也在不断投入,目前已横跨世界32个地理区域,并宣布计划新增5个左右的区域。而且今天亚马逊云科技的数据中心数量比第二大的云提供商多三倍,服务多60%,功能多40%。
我们都知道,全球第一款云服务是Amazon S3,Amazon S3提供目前从S3 Standard到S3 Glacier Deep Archive丰富多样的存储层级。亚马逊云科技也看到一些非常挑战的场景需要高性能分析处理的金融交易分析、欺诈检测、基于机器学习的量化交易等,这需要在几分钟之内访问数百万次存储的请求,并且它的延时需要保持在数毫秒的级别。
re:Invent发布了当前云中最快的对象存储服务Amazon S3 Express One Zone,它使用的是一个全新架构的Amazon S3的存储类别,采用专门设计的软硬件来加速数据处理,能够将存储访问的数据和高性能的计算应用就近部署。可提供比Amazon S3标准存储快10倍的性能,同时能够以一致的毫秒级延迟处理每分钟数百万次的请求,同时请求成本降低了50%。
通用芯片上,在2018年亚马逊云科技就推出了业界第一款自研的通用芯片Amazon Graviton,迄今为止已经发布了三代半。Amazon Graviton处理器基于ARM架构,re:Invent上亚马逊云科技推出Graviton的最新一代Graviton4,与当前一代Graviton3处理器相比,Graviton4性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上,基于Graviton4的Amazon EC2 R8g实例目前已提供预览。
并且基于Amazon Graviton3处理器的Amazon Elastic Compute Cloud(Amazon EC2)M7g通用型、C7g计算优化型和R7g内存优化型三款实例已经在15日落地中国。
亚马逊云科技是第一家在业界推出Serverless服务的云提供商,去年亚马逊云科技也成为首个数据分析服务全部实现Serverless的云供应商,今年,亚马逊云科技高级副总裁Peter又宣布了3项数据库和应用领域的Serverless创新。
Amazon Aurora Limitless Database是唯一一个真正使用无服务器化来实现的分片数据库,用户将不用再手动管理底层的物理服务器资源,Serverless可以自动实现资源的管理和扩缩容,同时按需付费,来最大限度帮用户降低成本。Amazon ElastiCache Serverless可以帮助客户在一分钟内创建高可用的缓存,并实时进行垂直和水平扩展以支持客户复杂的应用程序,且无需管理基础架构。Amazon Redshift Serverless新的基于AI的扩展和优化功能的预览,可根据多个工作负载维度自动调整资源并执行优化操作以完成预设的性价比目标。
亚马逊云科技还通过Amazon Local Zone、Amazon Outposts、Amazon Snowball、Amazon Private 5G等服务,来把云从中心拓展到边缘,并且还通过Amazon Ground Station加速卫星数据上云,把云计算带入太空。
同时“Kuiper计划”也是亚马逊云科技正在建设的一个项目,通过数千颗近地轨道卫星组成卫星网络,为地球上数亿个缺乏可靠的互联网连接的人们提供更加快捷、可靠的宽带服务,缩小数字鸿沟。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。