当谈论生成式AI时,我们大多都在谈论基础模型。整个生成式AI应用就像是浮在海面的冰山,露在外面的就是基础模型,但这只是冰山的一角,在冰川的底部,还有加速芯片,数据库,数据分析,数据安全服务等。
亚马逊云科技已经提供了完整的端到端的生成式AI技术堆栈,从底层的加速芯片,存储优化,到中间层模型构建工具和服务,再到最上层的生成式AI相关应用,每一层都在针对客户的不同需求持续创新。
就像亚马逊CEO Andy Jassy曾经说过,亚马逊云科技的使命是让任何人,哪怕他是在自己的宿舍或者车库里刚刚开始自己的创新之旅,也能够获得和大型企业一样先进的基础设施和成本来实现自己的创新。
所以在生成式AI的今天,亚马逊云科技的使命依然没有改变,希望通过提供为生成式AI所打造的工具和服务,致力于实现生成式AI的普惠化。
亚马逊云科技会以负责任的态度提供AI的服务,称为“Responsible AI”(负责任的AI),其中包含了公平和偏见、稳定性、可解释性、治理、透明度、隐私和安全性。亚马逊云科技大中华区产品部总经理陈晓建提到,在实现生成式AI的普惠化上,亚马逊云科技看到五个关键因素。
亚马逊云科技大中华区产品部总经理陈晓建
一,选择一个合适的场景,从典型场景入手创新业务模式
麦肯锡调研显示,生成式AI在营销和销售、产品和研发、软件工程和客户运营四个领域会率先带来价值。
Salesforce应用亚马逊云科技Amazon Bedrock和Amazon Titan集成到自己的生成式AI产品之中,让客户能够在Salesforce Data Cloud上轻松安全地使用数据,更方便地去构建自己的应用。
海尔创新设计中心和亚马逊云科技合作,实现了文生图、图生图、定量图和全景图的四方面实践,上线以后自动化设计系统应用使相关业务的操作周期缩短了20%。
二,借助于专门构建的生成式AI工具和基础设施,快速搭建高性价比的生成式AI应用
亚马逊云科技CEO Adam Selipsky曾说,没有一个基础模型可以适用于所有的业务场景,用户应该做的是根据自己的场景去选择一个最适合自己的基础模型。
目前Amazon Bedrock已经正式可用,Amazon Bedrock上面提供了广泛的基础模型以供选择,包括Meta、Anthropic、Cohere、AI21 Labs、Stability AI等第三方领先供应商,以及亚马逊云科技自研的Amazon Titan模型家族。亚马逊云科技是第一个把Llama2放在一个完全托管API的云服务的厂商。
Amazon Bedrock提供了一个无需编写代码就可以实现的托管代理Amazon Bedrock Agent,可以自动分解和编排任务,通过API连接到相关的数据源,并且可以连接到后端的Amazon Lambda来执行任务。
亚马逊云科技还提供了Amazon SageMaker JumpStart,可以获得更多的来自工业界和学术界的开源模型,同时其还提供了一个深度的定制环境和评估功能。
Amazon Bedrock解决了金山办公构建生成式AI应用的过程中,基础模型性能有限,数据隐私与安全难以保障,高额管理成本等现实情况。还在数据安全层面给金山办公提供了充分的支持,极大地提高了内部开发效率。
三,打造一个强大的数据基座,便捷、安全地使用私有数据,打造差异化竞争优势
亚马逊云科技一贯认为数据是每个客户的核心要素,构建数据底座需要三方面的工作,首先,需要存储各种各样类型的数据;其次,需要把来自于不同数据源的数据进行有效打通和汇聚;最后,需要有效的数据安全管理。
亚马逊云科技提供了端到端的数据服务,从存储到查询、分析数据到通过商业智能,机器学习和生成式AI来使数据发挥作用,以及能够轻松集成和治理数据,通过有效的安全策略管理数据的应用和开放的服务。
亚马逊云科技希望最终打造Zero ETL效果。陈晓建认为,数据集成不应该是人工工作的无底洞,需要一个更好的服务自动化、轻松地连接所有数据并加以使用。
西门子大禹团队在亚马逊云的技术支持下,为西门子中国量身打造了以人工智能生成的方式进行交互的智能聊天机器人“小禹”。通过“RAG 架构+向量数据库”设计了智能知识库暨智能会话机器人的解决方案指南,指南具备自然语言处理能力、知识库检索能力、甚至是以数据去训练大语言模型的能力。指南实现了目标知识库约80%功能,西门子中国根据企业内部需求再做20%定制化开发,最终形成完整的解决方案。
四,构建云原生乃至于AI原生的应用
陈晓建谈到,云原生架构已经为很多客户所熟悉,非常多的客户在亚马逊云科技的平台上打造他们完全基于云原生的业务。但是在生成式AI的今天,有很多人在思考,我们不仅需要一个云原生的架构,更需要一个生成式AI的原生架构。
搭建AI原生应用需要考虑微服务化、Serverless First、数据洞察、安全、避免重复造轮子几个方面。
第一,微服务化,通过一个事件驱动的架构,能够松耦合地处理每个模块之间的互相依赖,让应用可以在不断变化的需求之前保持快速进化和迭代的能力;
第二,Serverless First,Serverless可以把你从繁重的基础架构的运维、部署中解脱出来,让你能够有更多的精力关注到更该关注的业务逻辑和创新之中;
第三,数据洞察,数据是最重要的资产,要像重视其他资产一样重视数据。
第四,安全,企业要关注安全的围栏、影响面的控制,怎么样去减少爆炸半径,把安全和数据的合规和保护放在一个前所未有的重要的地位;
第五,在技术本身之外,在DevOps等其他现代化的指引里,重新持续地去投入,构建一个高效、敏捷的共建者文化。
五,使用多种开箱即用的服务降低工作的复杂性
亚马逊云科技提供的Amazon CodeWhisperer是一个人工智能的编程伙伴,它可以实时提供编程的代码建议,然后从根本上提升开发人员的生产力。和没有使用Amazon CodeWhisperer的开发者相比,使用Amazon CodeWhisperer的开发者在整个完成任务的速度上快了57%,成功率高了27%。
最近Amazon Whisperer推出了自定义功能,能够生成优于之前的代码建议,它允许客户使用私有代码库安全地定制 CodeWhisperer代码建议,这些私有代码库可涵盖内部API、数据库、最佳实践和架构模式等。
亚马逊云科技通过开箱即用的生成式AI服务及工具,已帮助1000+中小企业和初创公司快速实现生成式AI创新,已赋能10W+中国开发者。
同时亚马逊云科技还将Amazon Quicksight Q功能与Amazon Bedrock提供的大语言模型功能相结合,为Amazon QuickSight提供生成式BI功能。
亚马逊云科技大中华区技术专家团队总监王晓野也看到,企业正在各种各样的场景尝试生成式AI的应用,但是在“最后三公里”,也就是落地走向生产,被业务认可的少之又少。
现在亚马逊云科技生成式AI的能力已经覆盖了三大层面,通过为客户提供相关服务观察到,年初企业更加关注底层也就是芯片、算力,以及快速训练出模型,但是到今天企业对于算力和训练的要求依然在,不同的是更加注重在推理上如何配合好整个数据的基础架构、网络,在这些模块上怎么构建大规模的应用,以及如何跟业务更好的结合。
现在生成式AI的场景非常多,在做开箱即用的生成式AI产品时,亚马逊云科技会继续从客户需求出发。王晓野提到,未来生成式AI不一定是最终以一个应用的形态推出,生成式AI能力正在集成到已有的产品中,这种情况会越来越多的发生。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。