世界的十字路口在纽约,生成式AI的十字路口今天也在纽约。
亚马逊云科技纽约峰会素有小re:Invent之称,今年的发布主要围绕生成式AI展开。其实从去年10月到今年4月,我们已经看到亚马逊云科技在生成式AI上的不断投入。
目前已经形成了三层架构形态,底层的Amazon EC2 Trn1n和Amazon EC2 Inf2实例正式可用,中间层的生成式人工智能服务Amazon Bedrock预览版,顶层的自动代码生成工具Amazon CodeWhisperer正式可用。
今天亚马逊云科技把生成式AI的三层架构规划为加速、构建、应用,并再度扩展其边界。亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian也希望可以真正帮助各行各业能把生成式AI用起来。
亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian
GPU生成式AI的加速器
俗话说底层基础决定上层建筑,我们先从底层讲起。说到人工智能的底层,大家都会想到GPU,其高度的并行计算能力,对加速人工智能模型的训练和推理已经是必备条件。
可以提供多种算力能力的亚马逊云科技肯定也少不了GPU实例的更新,亚马逊云科技和英伟达有着12年的合作历史,所以合作GPU实例也是顺理成章,宣布了Amazon EC2 P5实例正式可用。
Amazon EC2 P5实例提供8个英伟达H100 Tensor Core GPU,具有640 GB高带宽GPU内存,同时提供第三代AMD EPYC处理器、2TB系统内存和30TB本地NVMe存储。该实例还提供了3200 Gbps的聚合网络带宽并支持GPUDirect RDMA,从而绕过CPU进行节点间通信,实现更低的延迟和高效的横向扩展性能。与上一代基于GPU实例相比,训练时间最多可缩短6倍(从几天缩短到几小时),降低高达40%的培训成本。
其实现阶段正是生成式AI的爆发阶段,企业对于H100的需求也是爆发性的,使用GPU这件事上不管在全球任何一个区域都是毋庸置疑的。
更多的模型,更快速的构建
现在很多企业都在倡导通用模型的重要性,但是亚马逊云科技却在这一点上选择,集合更多的模型来服务客户。
Amazon Bedrock是允许用户通过API访问AI21 Labs开发的Jurassic-2多语种大语言模型系列、Anthropic开发的大语言模型Claude、Stability AI开发的文生图基础模型Stable Diffusion,以及亚马逊云科技自有的Amazon Titan模型。
今天Amazon Bedrock不仅做了模型的扩展,同时进行了原有模型的升级。增加了Cohere的模型,Cohere是一家成立于2019年的初创公司,最近其也完成了2.7亿美元的C轮融资。Cohere可以帮助企业快速部署对话式AI聊天机器人、生成式搜索引擎、文本摘要总结、增强向量搜索等。
同时Amazon Bedrock针对Anthropic和Stability AI的模型进行更新,包括Anthropic最新的语言模型Claude 2.0和Stability AI将在Amazon Bedrock上发布的最新版文生图模型套件Stable Diffusion XL 1.0 (SDXL 1.0)。
Claude 2.0在业内有很多种说法,一度有Claude成为ChatGPT最佳代替品的讨论,堪称媲美 GPT-4。而且其可以支持高达100K token的上下文,所以Claude一次读上百页的文档都不在话下,对于有智能文档处理需求的客户是一个福音。
Amazon Bedrock想做的是在模型上给到客户选择的同时,又不是那么难选,因为亚马逊云科技已经经过了筛选。
现在很多企业在使用模型上,最大的难点可能不在模型本身,而是构建应用的能力。亚马逊云科技大中华区技术专家团队总监王晓野提到,现在企业要面临的问题是使用模型后获得了什么,如果通过模型重塑应用后效果提升,但是成本成倍增加,企业可能从ROI层面考虑。
亚马逊云科技做的就是把部署成本降低,应用难度降低,更容易快速让企业用上生成式AI。当然对于模型训练,企业也比原来更加注重数据质量,因为训练不是数据越多越好,更重要的是数据质量,同时你的数据也是你的差异化因素。
Amazon Bedrock另一个更新就是代理功能(Agents),这将进一步加速交付生成式AI应用程序。Amazon Bedrock代理功能可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,而且这些都是自动和托管的。
通过Agents结合模型能力企业可以为内部或外部实现自动化的构建。Swami在现场也举了生成一个退休计划的例子,在不需要提供更多信息的情况下,Agents会通过程序访问到自己的过往的数据,以及一些外部信息,最终制定好符合的计划。
Agents是对程序自动化工作需求的一个补足,通过Agents大家可以构建自己的生成式AI应用,大大加强用自己的数据构建。
在构建层,亚马逊云科技还推出适用于Amazon OpenSearch Serverless的向量引擎,Amazon OpenSearch Serverless提供了向量数据库的检索能力,控制模型的表现需要给予更多的信息,把这些信息存在某个数据库里,然后通过向量数据库先检索出来相近的知识,再给到模型就会得到相对较好的回答。未来,所有亚马逊云科技的数据库都将具有向量功能,帮助客户简化运营,方便集成数据。
真实需求驱动多元应用场景
亚马逊云科技一直也在场景上通过生成式AI进行赋能,编程助手Amazon CodeWhisperer可以使开发者的开发速度平均提升57%,开发效果提升27%。
今天则从三个场景进行了扩展,第一个场景是Amazon CodeWhisperer正式可用,并与Amazon Glue实现集成,数据流开发要把数据从不同数据源转移到另一个地方,这就需要撰写大量的代码。
AWS Glue当时就是2017年在纽约发布的,一个完全托管的,提取、转换和加载(ETL)服务,客户能够轻松准备和加载他们的数据到Amazon S3、Amazon Redshift、Amazon RDS中,以及加载数据到运行在 Amazon EC2 上的数据库,来进行查询和分析。
现在Amazon CodeWhisperer就可以帮助Amazon Glue用户优化使用体验、提高开发效率。开发人员可以用自然语言(英语)编写特定任务,比如利用json文件中的内容创建一个Spark DataFrame。
第二个场景是Amazon QuickSight新增生成式BI功能,将Amazon Bedrock提供的大语言模型能力与支持自然语言问答的Amazon QuickSight Q相结合。
第三个场景是Amazon HealthScribe构建医疗应用程序,Amazon HealthScribe符合HIPAA(《健康保险责任与保护法》),能够帮助医疗软件供应商构建临床应用程序,Amazon HealthScribe通过Amazon Bedrock的支持,让医疗软件供应商能够更快、更轻松地将生成式AI功能集成到其应用程序中。
而且Amazon Entity Resolution正式可用,让现在无需移动数据就可以帮助企业轻松分析、匹配和关联相关记录,这些记录可能存储在应用程序、不同的数据获取渠道和数据存储中。以前广告和广告主需要通过统一的ID来进行特定人群的推送,这就需要先将数据筛选好再给到电商平台,现在则可以在保护隐私的前提下就能做到模式识别,进行精准推荐。
总之,今年的亚马逊云科技纽约峰会既有情理之中,也有意料之外,情理之中是三层架构的进一步完善,意料之外是应用场景的多元化,以及GPU实例未来在中国的落地值得期待。
好文章,需要你的鼓励
随着各行各业数字化变革的不断深入,人类社会正加速迈向智能化。作为智能世界和数字经济的坚实底座,数据中心也迎来了蓬勃发展。面
“未来软件定义汽车”的设想也成为马丁当前运营路线的指导方针,且高度关注数据、零件和资产管理等议题。