从去年的GenAI到今年的Agentic AI,新一轮的AI落地正进一步加速。
今年re:Invent,亚马逊云科技的关注点也发生了根本变化,不再强调“生成式 AI 产品矩阵”,而是着手构建一套系统性的Agentic AI生态,让Agent不止能调用工具,而是能够稳定、持续地执行真实业务。
聚焦生产级AI Agent的构建,亚马逊云科技Agentic AI副总裁Swami Sivasubramanian提炼出四条关键路径:构建、效率、可信、可靠,构成从概念验证到生产部署的完整技术体系。
这四个路径恰好对应Agent的开发、推理、决策、执行全生命周期。而且re:Invent带来了多项全新能力升级,为这一路线补齐了关键拼图。
亚马逊云科技Agentic AI副总裁Swami Sivasubramanian
一、Easy to Build易于构建:Agent的门槛正在被重写
构建Agent说难不难,说简单也不简单。因为真正阻碍企业落地的往往不是模型,而是工程体系。亚马逊云科技正在进一步降低这道门槛,让企业能够以最少的工程量搭建出真正“跨工具、跨系统、可执行任务”的Agent。
今年7月的纽约峰会上,亚马逊云科技就已经带来了Amazon Bedrock AgentCore,它提供不是某一个具体Agent,而是企业构建Agent所需的一整套通用能力底座。
可以说Amazon Bedrock AgentCore正在将阻碍Agent从PoC走向生产的五大难题逐一拆解:AgentCore Runtime提供无服务器、完全会话隔离的运行环境;AgentCore Memory引入情景记忆Episodic Memory,让Agent能基于历史经验持续学习;AgentCore Identity打通亚马逊云科技与第三方服务的统一IAM体系,使身份与权限管理可管理;AgentCore Gateway实现工具、数据与其他Agent的智能发现与安全接入,构建跨系统的执行能力;AgentCore Observability将工作流、运行状态全面纳入可观测体系,与CloudWatch深度集成。
亚马逊云科技的目标,是把构建Agent的过程标准化、模块化,让开发者专注于业务逻辑,把基础设施的复杂性全部交给自己来承担。
与此同时,亚马逊云科技还推出了开源框架Amazon Strands Agents SDK,进一步降低Agent 的开发门槛。其利用大模型的推理能力自主完成规划与工具调用,开发者只需提供提示词和工具列表,Agent即可自行判断何时、如何执行任务。相比传统的预定义工作流,这种方式显著简化了构建过程,让Agent真正具备“自我决策、按需行动”的能力。
目前Amazon Strands Agents SDK的下载量已经超过500万次。随着TypeScript支持和边缘设备能力的加入,开发者可以用最少的代码构建出可执行真实任务的Agent。
Amazon Strands Agents SDK工程化价值也在企业实践中迅速验证,Cox Automotive将车辆估价流程从2天压缩到30分钟;Blue Origin部署了2700个Agent覆盖了70%的员工,在 T-REX项目中工程师交付效率提升75%,质量提升40%。
二、Efficiency效率:让Agent不止能跑,还能跑得快
模型定制可以构建高效的Agent,但企业最大的问题不是你是否应该定制你的模型,而是能以多快的速度开始。
如今大模型在企业任务中已经足够智能,但效率与专业度往往难以兼得。亚马逊云科技则定制三项技术构建高效Agent:监督微调将通用模型转变为领域“专家”;模型蒸馏可以在保留95–98% 效果的前提下带来最高10倍推理提速,使轻量模型可规模化部署;强化学习则基于行动反馈持续优化策略,让Agent的决策更稳健、更贴近业务预期。
然而,要让Agentic AI真正成为企业级工具,还需要新的效率引擎,四项新增能力展示出亚马逊云科技如何实现高效训练、微调和规模化执行上的全面提升。
能否消除所有复杂性和成本,同时获得先进的训练技术?这就是Amazon Bedrock推出强化微调(Reinforcement Fine-Tuning, RFT)的原因。强化微调可以帮助客户无需深厚的机器学习专业知识或大量标记数据,就能提高模型准确性,现在Amazon Bedroc自动化了整个强化微调工作流程,平均使模型的准确性提升66%。目前支持Amazon Nova,很快将支持开放权重模型。
目前,Amazon Bedrock已经提供了模型微调功能,但许多客户仍希望完全掌控定制,并充分利用自身数据。Amazon SageMaker AI推出了无服务器模型定制能力,支持对Amazon Nova、Qwen、Llama、DeepSeek等热门模型进行定制,并可通过简单几步直接部署到Amazon Bedrock或SageMaker上。同时,支持RLAIF、RLHF、DPO等强化学习技术,能够基于最适合任务的模型实现精准定制。
训练基础模型通常需要大量资金与技术能力,现在借助Amazon Nova Forge,企业可以以最简便、最具成本效益的方式构建前沿模型。可以在训练检查点,将专有数据与亚马逊云科技的数据集混合使用,从而打造出既具前沿智能,又针对特定行业和业务用例量身定制的模型。
在模型构建或训练过程中,常会发生故障。随着模型规模扩大、训练集群增大,故障频率也随之上升。Amazon SageMaker HyperPod推出了Checkpointless Training无检查点训练功能,能够在几分钟内自动恢复训练,大幅降低故障恢复时间和成本。
三、Trust信任:如何让一个能自主行动的Agnet变得可信?
目前看来,Agent最大的问题不是能力,而是可控性。企业需要知道Agent为什么做出这个决策?是否越权?能否审计?
模型会产生幻觉、在复杂规则或逻辑上出错,推理过程也存在缺陷。如果缺乏信任,就需要在每一步加入人工干预,或将操作流程编码化,但这些措施都会削弱Agent的创造力和自主性。
如何在保证Agent自由度的同时,明确安全操作边界?
自动推理与大型语言模型的结合提供了解答,就是所谓的“神经符号AI”。亚马逊云科技通过三种方式应用:第一,验证大型语言模型输出,并在发现问题时建立反馈循环;第二,基于自动推理输出训练大型语言模型,如使用Lean定理证明器;第三,将自动推理验证器嵌入大型语言模型推理基础设施,实现“约束编码”。
受亚马逊云科技内部规范与自动推理成功实践的启发,Kiro团队也将规范理念直接融入产品,实现范驱动的生成式IDE,通过规范指导代码生成、测试生成及正确性验证。
另外关于信任,re:Invent首日还发布了Policy in Amazon Bedrock AgentCore,其提供了实时且确定性的审计与控制能力,管理Agent与外部工具及数据的交互。用户可用自然语言描述允许的操作,系统会将其转换为基于开源授权语言Cedar的形式化表示,其语义在Lean定理证明器中得到形式化验证。近期,还加入了基于自动推理的分析功能,可用于推演和验证策略的语义。
四、Reliability可靠性:Agent从“能跑”到“能长期稳定运行”
对于Agent,模型固然重要,但是运行稳定性也同等重要,亚马逊云科技正将“执行可靠性”升级到基础设施等级。
Amazon Nova Act今年早些时候推出了预览版,在re:Invent大会上也正式发布。Amazon Nova Act能够帮助开发者构建、部署和管理大量可靠的Agent,从而实现生产环境UI工作流程的自动化。它基于定制的Amazon Nova 2 Lite模型,能够出色地驱动浏览器、支持API调用,并在必要时将问题升级至人工处理。
Swami Sivasubramanian做了一个比喻,就像建立数百个强化学习“健身房”,让Agent在其中运行数千个工作流程,经过数十万次交互不断学习模式,最终具备可靠应对现实企业场景的能力。
目前Amazon Nova Act在企业工作流程中实现90%可靠性,与其他AI框架相比,能以最快的速度实现价值,并简化部署过程。
另外,re:Invent第一天发布的AgentCore Evaluations也是CIO反响最强烈的功能之一,其可以使用内置评估工具来评估常见的质量维度,例如正确性、帮助性、工具选择准确率、安全性、目标成功率和上下文相关性。
“这是因为企业在构建Agent时面临的一个关键挑战就是周期过长,评估能力是加速Agent开发与落地的核心环节。”亚马逊云科技Agentic AI总监Madhu Parthasarathy说道。这背后主要原因在于信心的构建。
Agent具备一定的判断能力和自主性,关系到客户有信心部署Agent,一个智能体从原型开发到要调整再到落地需要很长的时间,引入评估机制后,企业无需承担重型工作负载,开发周期可以从几个月缩短到几天。
写在最后
如今,亚马逊云科技构建的是整个Agentic AI生态,而不是单点产品。而且四大路径也不是功能分类,是系统性工程。Forrester副总裁兼首席分析师戴鲲指出,此次是亚马逊云科技首次以系统化方式推出Agentic AI生态,对CIO和CTO而言,这不仅是技术升级,更是组织运营模式重构的起点。
未来的企业,不只是会使用AI的企业,而是能够实现自治智能的企业,而亚马孙云科技给出了系统级的答案。
好文章,需要你的鼓励
太空物联网连接服务商Myriota宣布其HyperPulse连接平台正式商用,该平台结合公司5G非地面网络架构与从Viasat租赁的L波段容量。该平台采用波束跳跃技术,根据流量需求激活所需波束,优化电池供电物联网设备功耗。相比UltraLite服务,HyperPulse提供更低延迟和更高日数据传输量。服务将于12月15日在美国、墨西哥、巴西、澳大利亚和沙特正式上线。
昆仑万维Skywork AI团队开发的Skywork-R1V4是一款突破性的多模态AI助手,能够像侦探一样主动分析图像、上网搜索信息并将两种能力无缝结合。该系统仅通过3万个高质量样本的监督学习就实现了卓越性能,在多项测试中超越了更大规模的商业模型,证明了精妙设计比单纯扩大规模更重要,为AI助手的实用化发展指明了高效路径。
AMD与HPE宣布扩大合作,共同开发下一代开放式可扩展人工智能基础设施。HPE将成为首批采用AMD Helios机架规模AI架构的系统供应商,该架构整合了AMD EPYC处理器、Instinct GPU、Pensando网络技术和ROCm开源软件栈。Helios平台每机架可提供2.9 exaFLOPS的FP4性能,采用开放机架宽设计标准,旨在简化大规模AI集群部署。HPE计划2026年全球推出该解决方案。
香港科技大学研究团队开发出FlashVGGT技术,通过创新的"压缩代表"策略和分块递归推理机制,将3D重建速度提升10倍以上,能处理超过3000张图像的超长序列。该技术在保持重建质量的同时显著降低计算复杂度,为VR游戏、建筑测量、自动驾驶等领域提供更实用的3D重建解决方案。