今年亚马逊云科技re:Invent传递出一个非常重要的信号,从传统云基础设施供应商,转型为AI基础设施与服务领军者。
亚马逊云科技首席执行官Matt Garman第二次登上re:Invent的舞台显得更加游刃有余。他首先po了几个数据,展示出过去一年的增长轨迹:整体业务规模达1320亿美元,同比增长 20%,一年净增约220亿美元;S3客户已存入超过500万亿个对象,日均峰值请求量超过每秒2亿次;连续第三年,新增的云端CPU容量超过一半来自Graviton;Amazon Bedrock服务超过10万企业。
Matt Garman提到亚马逊云科技一直在创新的路上,AI正在重塑每一个行业,但很多企业没有看到相应的回报,这是因为AI的真正价值还没有被释放。
如今他看到Agent的出现让企业的投资开始看到成果。未来每个企业都将会有很多Agent,处理更多的事情,每个企业都可以从AI中得到更多价值,所以亚马逊云科技对人工智能基础设施、推理平台、企业数据、构建Agent的工具进行创新,帮助企业可以自由的发明下一步。
亚马逊云科技首席执行官Matt Garman
Trainium正在改写AI底层逻辑
谈到AI基础设施,首先想到的就是GPU。当下最炙手可热的无疑是英伟达,而亚马逊云科技正是全球运行英伟达GPU的最佳场所。
亚马逊云科技与英伟达已有15年的合作,具备大规模 GPU 集群的运营经验。今年P6e-GB300 UltraServer也正式上线。P6e-GB300 UltraServer采用NVIDIA GB300 NVL72加速显卡,相比P6e-GB200相,GPU内存和FP4计算能力分别提升1.5倍。
拥有最绝佳的AI能力,就需要最好的训练和推理能力,亚马逊云科技一直在为人工智能负载提供最佳的性价比,目前亚马逊云科技Trainium的业务规模已达数十亿美元,迄今为止已部署了100万颗Trainium芯片。
AWS Trainium 3的目标是让AI工作负载更好,更快,更具成本效益。基于AWS Trainium 3的Amazon EC2 Trn3 UltraServers已经上市,其是面向下一代 Agent、推理和视频生成等高密度应用,提供更优的性价比与更稳定的算力基础。与上一代相比,性能提升了4.4倍,内存带宽提升了3.9倍,每瓦性能提升超过3.5倍。
同时,AWS Trainium 4的研发也在进行中,届时所有维度都将实现巨大跃升,预计FP4计算性能提升6倍,内存带宽提高4倍,高带宽内存容量提高2倍,支持全球最大规模模型的训练需求。
重新定义下一代AI交互形态
所有应用都在被AI重构,Amazon Bedrock提供了一个安全的、可扩展的、功能丰富,正在成为企业构建AI工作负载的底座。
亚马逊云科技一直认为没有一个模型可以解决所有问题,所以Amazon Bedrock也得到了众多客户的选择。今天Amazon Bedrock原生支持模型又新增了4个。目前中国模型已经有Deepseek、Qwen,加上新增的Kimi和Minimax,接近全部模型的1/4。
酒香不怕巷子深,但是自家模型还是要拿来夸一夸。去年众星捧月,集万千期待一身的Amazon Nova由亚马逊首席执行官Andy Jassy亲自发布,并且发布了6种基础模型,经过一年发展到了8种。
去年Andy Jassy就预告了,要推出Amazon Nova Speech-to-Speech语音对语音模型和Amazon Nova Any to Any 任意模态生成任意模态模型。
今年Amazon Nova 2如期而至,包括Lite、Pro、Sonic三款。Lite是一款快速、经济高效的推理模型,适用于日常工作负载;Pro适用于高度复杂的多步骤任务;Sonic是面向对话式人工智能的全新Speech-to-Speech模型。
同时还发布预览版Amazon Nova 2 Omni,可完成多模态推理和图像生成,是业内首个支持文本、图像、视频、音频输入,并支持文本与图像输出的推理模型。
从大模型到“我的模型”,重写AI训练范式
Matt Garman一直听到客户想要一个“能够真正理解我的数据”的前沿模型或Agent。因为只有当正确的模型与企业自有数据深度结合,AI价值才能被真正释放。
Amazon Nova Forge正是基于这一需求而生:引入“开放式训练模型”理念,实现访问多种 Nova训练检查点,并在训练的每一个阶段,将自有数据注入其中,训练专属模型,同时还可使用亚马逊的丰富数据集。
比如一家企业掌握数百GB数据、数十亿token,涵盖过往设计、故障模式、评审记录等核心数据。企业从一个已完成80%预训练的Amazon Nova 2 Lite检查点开始,将自有数据与亚马逊云科技的数据集融合,并按照预置配方完成剩余的训练流程,最终得到的模型既融入了企业独有的领域知识,又保留了大模型推理等底层能力。
目前Booking.com、nimbus、NRI、Reddit、SONY已经成为Nova Forge的早期用户。Matt Garman认为,Amazon Nova Forge会彻底改变企业使用AI的方式。
SONY一直希望交付给客户“感动”,其通过对20多个Amazon Nova 2 Lite进行微调,实现了在一致性和文档等任务方面优于基础模型,目标将SONY合规审查和评估流程的效率提高100倍。
“AWS一方面相对谨慎投入自研模型Nova系列,定位于高性能、低成本,覆盖推理、对话、代码生成、语音交互等场景,强调多模型组合;另一方面战略投入开放生态,不断引入包括中国厂商提供的模型在内的第三方模型,同时借助Amazon Nova Forge帮助企业加速模型调优。”Forrester副总裁兼首席分析师戴鲲说道。
从工具到自治系统的跨越已经开始
孩子的成长需要自由同样需要约束力,通过制定一些基本规则来避免重大问题,Agent也是一样的道理。
Amazon Bedrock AgentCore能够安全、规模化地构建、部署与运营Agent,今天又推出了两项新功能,Policy in AgentCore和AgentCore Evaluation。
Policy in Amazon Bedrock AgentCore,可以根据策略评估每一个Agent,阻止Agent超出你的请求范围,让模型遵守明确的界限和要求。另外人需要定期做体检,Agent呢?AgentCore Evaluations能够使用内置评估工具来评估常见的质量维度,例如正确性、有用性、无害性等,而且评估是自动化的。
Kiro是一个用于结构化AI编码的Agent开发环境,让开发者在提高AI编码速度的同时,拥有更强的结构和掌控力。原本需要30名开发者花18个月的项目,他们仅用了6名成员、76天就全部完成,效率的提升是翻天覆地的。
最后想再说说,三款全新的前沿Agent:Kiro自主Agent、Amazon Security Agent和Amazon DevOps Agent。
Kiro自主Agent面向软件开发,自主处理复杂编码任务,深度集成开发流程;AWS Security Agent构建更安全应用,主动扫描漏洞,将渗透测试转为按需服务;AWSDevOps Agent卓越运维,自动诊断并预防故障,即时响应。
前面讲的都和AI相关,最后Matt还用10分钟,极限发布了25项底层的新产品和新功能,为第一天的Keynote收尾。
写在最后
全球各大云厂商都在面向AI原生云加速演进。“今年re:Invent充分体现了AI原生云在服务平台化、软硬一体化、技术生态化、能力场景化四个维度的发展趋势。”戴鲲认为,亚马逊云科技一系列发布在全栈布局、自研硬件和生态开放三个层面都有了显著拓展与提升。但要赢得企业心智,还需加速相关云服务落地,简化传统业务系统集成的复杂度,进一步提升上下文工程能力和智能体与人工流程混合编排能力,以及为行业场景化落地提供更多支持。
可以看到,亚马逊云科技正在试图重塑企业使用AI的方式,在模型、数据、算力和应用场景上形成完整的闭环。
好文章,需要你的鼓励
这项由Snowflake AI Research发表的研究挑战了传统语言学对大型语言模型的批评,通过引入波兰语言学家Mańczak的理论框架,论证了LLM的成功实际上验证了"频率驱动语言"的观点。研究认为语言本质上是文本总和而非抽象系统,频率是其核心驱动力,为重新理解AI语言能力提供了新视角。
微软于12月1日正式关闭混合现实协作平台Mesh,将用户引导至Teams的沉浸式活动功能。Mesh作为独立服务在2024年正式发布,提供3D虚拟会议环境,但与Teams功能重叠明显。微软已将相关功能直接整合到Teams中,需要商业Teams许可证和Premium许可证才能主持沉浸式活动。这标志着微软元宇宙雄心的终结,公司已放弃HoloLens项目和美军合同,转向AI发展战略。
freephdlabor是耶鲁大学团队开发的开源多智能体科研自动化框架,通过创建专业化AI研究团队替代传统单一AI助手的固化工作模式。该框架实现了动态工作流程调整、无损信息传递的工作空间机制,以及人机协作的质量控制系统,能够自主完成从研究构思到论文发表的全流程科研工作,为科研民主化和效率提升提供了革命性解决方案。