在Amazon Bedrock发布一周年之际,其迎来多个重磅更新。
自从亚马逊云科技去年推出这一服务以来,Amazon Bedrock已经彻底改变了生成式AI领域,引领着技术前沿。最近,亚马逊云科技的官方博客发布了8篇关于Amazon Bedrock的相关文章,阐述了最新的更新内容。
Amazon Bedrock是亚马逊云科技首次针对生成式AI发布内容之一,其是一项完全托管的服务,通过单个API提供来自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI 和Amazon等人工智能公司的高性能基础模型(FM),以及通过安全性、隐私性和负责任的AI构建生成式人工智能应用程序所需的一系列广泛功能。
新功能包括了客户运行专属完全托管模型的专有模型导入功能,为特定应用场景选择最佳模型的模型评估功能,为生成式AI应用程序提供易于实施的保护措施的Guardrails功能,以及新增了更多可选择的新模型。
下面我们将详细介绍这些功能更新和模型的新特性,展示Amazon Bedrock如何持续推动生成式AI技术的边界。
功能更新1:Amazon Bedrock专有模型导入功能现已推出预览版,并支持三种最受欢迎的开放模型架构:Flan-T5、Llama和Mistral,并计划未来支持更多模型。
客户可以在Amazon SageMaker上使用定制模型,该模型提供超过250种预训练基础模型。基础模型包括Mistral、Llama2、CodeLlama、Jurassic-2、Jamba、pplx-7B、70B等尖端型号,以及令人印象深刻的Falcon 180B。现在,用户在Amazon SageMaker中定制的模型将能够在Amazon Bedrock中使用,以获得后者提供的更多强大功能。
借助全新的Amazon Bedrock专有模型导入功能,用户能够将本地微调后的开源模型(Llama,Mistral及Flan-T5框架)上架Bedrock,以托管API方式来调用,无需运维。只需通过点击操作,客户即可以在Amazon Bedrock中访问其定制模型,无论这些模型是它通过Amazon SageMaker开发的还是用其他的工具开发的。只需模型通过自动验证流程后,即可使用Amazon Bedrock的一系列功能来加速其生成式AI应用开发。
功能更新2:Amazon Bedrock Guardrails功能正式可用,可以控制FM输出内容合规性,实现负责任AI。
Amazon Bedrock在基础模型的原生能力之上提供了行业领先的安全保护,能够帮助客户阻止高达85%的有害内容。Guardrails是唯一一项由顶级云服务商提供的解决方案,它允许客户在单一服务中同时拥有内置和定制的防护机制,并可与Amazon Bedrock中的所有大语言模型(LLMs)以及经过微调的模型一起使用。
功能更新3:Amazon Bedrock模型评估功能正式可用,支持默认测试集程序自动评估,内部测试集人工评估等多种方式评价模型效果。
企业可以快速分析和比较Amazon Bedrock上模型,让评估模型的时间从几个星期缩短到几个小时,从而促使他们更快地推出新的应用程序并改善用户体验。客户可以通过选择预定义的评估标准(例如准确性和鲁棒性)并上传自有数据集/提示词库,或者从内置的、公开可用的资源中进行选择。对于主观标准或需要细致判断的内容,Amazon Bedrock使客户能够轻松将人工审核融入工作流程中,以根据特定应用场景的指标(如相关性、风格和品牌声音)对模型进行评估。
功能更新4:Amazon Bedrock代理(Agent)功能引入简化的创建和配置体验,使得开发人员轻松上手,同时推出了控制权返还(return of control)功能,允许在代理调用工具的时候接管控制权,为用户提供更多的选择权。
针对代理功能的简化,包括快速创建代理、在代理构建器(Agent builder)中进行代理配置的操作、无需提供API架构的简化配置等。其中控制权返还功能使得开发时可以跳过使用Amazon Lambda函数,并将控制权返回给调用代理的应用程序。
应用程序可以直接调用自己的内部系统或外部系统的API,而不必通过代理作为中间人。这意味着开发者可以更精细地控制如何处理数据和API调用,提高了系统的响应速度和灵活性。代理仍然负责处理复杂的逻辑和任务分解,但在执行具体的API调用时,控制权可以归还给应用程序,以适应更复杂或特定的集成需求。这种方式可以简化配置,减少对额外中间层的依赖,从而在系统设计中实现更直接的控制和更高的效率。
功能更新5:Amazon Bedrock 代理功能加入对支持Claude 3 haiku和Claude3 sonnet的支持,以Claude 3作为大脑的代理将更加智能。
Amazon Bedrock正式推出来自Anthropic的Claude 3 Opus模型,该模型是Claude 3家族中最智能的模型,在高度复杂的任务上表现卓越,并拥有惊人的流畅性和类似人类的理解能力,能够高效应对开放性提示和未知的全新场景。至此,Amazon Bedrock也成为了首个提供所有Claude 3系列模型的全托管服务,其中包括Claude 3 Opus和此前推出的Claude 3 Sonnet与Claude 3 Haiku。
功能更新6:Amazon Bedrock知识库功能支持通过跨账号的数据源构建知识库。
Amazon Bedrock知识库现在支持在单个知识库中添加多个S3存储桶作为数据源,包括跨账户访问。这一增强功能允许用户无缝地聚合和使用来自各种来源的信息,从而提高了知识库的全面性和准确性。通过支持多个S3桶作为数据源,客户无需创建多个知识库或冗余数据副本,从而优化成本。
功能更新7:Amazon Bedrock知识库功能支持Ephemeral RAG(chat with your document),用户直接上传文件而无需使用向量数据库的方式来快速构建RAG,便于快速测试验证。
现在用户无需配置知识库即可通过本地上传的文档或存储在Amazon S3中的文档聊天,以询问有关该文档的问题,并进行分析、创建摘要、逐项列出编号列表中的字段或重写内容。
模型更新1:Meta Llama 3 (8B和70B两个版本)正式可用,最强开源模型已经登录Amazon Bedrock。
Amazon Bedrock中现在可以使用两种新的 Llama 3 模型,Llama 3 8B非常适合有限的计算能力和资源以及边缘设备。该模型擅长文本摘要、文本分类、情感分析和语言翻译。Llama 3 70B 非常适合内容创建、对话式 AI、语言理解、研究开发和企业应用程序。该模型擅长文本摘要和准确性、文本分类和细微差别、情感分析和细微差别推理、语言建模、对话系统、代码生成和遵循指令。
模型更新2:预发布Titan Text Embedding v2,更好的准确性及更加灵活的向量空间维度(256, 512及1024)及更低的价格({zhiding_content_info_22}.02/m tokens)。
Amazon Titan Text Embeddings V2模型降低了存储和计算成本,同时提高了准确性。通过为客户提供灵活的嵌入(embeddings)功能,将存储需求降低至原来的四分之一,显著降低了运营成本,同时在RAG应用场景中保持97%的准确性,表现优于其他领先模型。
模型更新3:Titan Image Generator正式可用,支持版权问题赔偿及水印检测功能。
Amazon Titan Image Generator 现已在Amazon Bedrock中全面推出,这将为用户提供了一种简单的方法来构建和扩展具有新图像生成和图像编辑功能(包括即时自定义图像)的生成式 AI 应用程序。同时Titan Image Generator 的水印检测现已在Amazon Bedrock 控制台中全面推出,新的 API(预览版),用于检查此水印是否存在,并帮助您确认图像是否由 Titan Image Generator 生成。
在官方博客文章中,亚马逊云科技展示了创建“鹦鹉吃香蕉”图像的成果:
模型更新4:宣布即将支持Cohere的Command R和Command R+企业级基础模型。
Cohere的两款模型具有高度可扩展性,并针对长上下文任务进行了优化,例如检索增强生成 (RAG),通过引用来减轻幻觉,使用多步骤工具自动执行复杂的业务任务,并支持 10 种语言进行全球运营。Command R+是Cohere最强大的模型,针对长上下文任务进行了优化,而Command R则针对大规模生产工作负载进行了优化。
现在越来越多的客户已经开始使用Amazon Bedrock,球领先的信息和分析提供商LexisNexis Legal & Professional在Lexis+ AI上开发了个性化法律生成人工智能助手;全球领先的综合营销和技术服务提供商之一电通,在过去的三个月里,利用Amazon Titan Image Generator模型的预览版,通过自然语言提示词创造了大量逼真的专业级图像;全球AI客户关系管理(CRM)领域的领导者Salesforce,通过Amazon Bedrock新的模型评估功能提供自动化与人工评估两种方式加速模型比较和选择。
亚马逊云科技AI和数据副总裁Swami Sivasubramanian博士表示,企业应用Amazon Bedrock正呈现出爆炸式的增长。成千上万不同规模,来自不同行业的企业选择Amazon Bedrock作为他们生成式AI战略的核心基础,它极大加速并简化了企业从试验阶段到实际生产的转变。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。