由于新冠疫情,今年的亚马逊re:Invent也首次来到线上,并且第一次免费向全球开放。和往年一样AWS CEO Andy Jassy首先带来了最新的财务状况披露,AWS 2020年第三季度年化收入460亿美元,同比增长29%,实现100亿美元的增长。
AWS CEO Andy Jassy
AWS每增长100亿美元的时间正在逐渐缩短,实现第一个100亿美元收入用了123个月,第二个100亿美元增长用了23个月,第三个100亿美元增长用了13个月,第四个100亿美元增长用了12个月。
疫情会造成一些业务的停顿,在这期间所有企业都在尽可能的节约成本,同时疫情期间企业也更多开始用云来开展业务,疫情推动云计算市场至少几年的发展速度。在Andy看来,“我们很难打造一个长期可持续性的企业,所以我们要不断地重塑,再造自己,才能够生存下来。”
在过去的9个月中,Andy思考了很多企业重塑的问题,企业需要去校准自己,而不是别人追着你让你去改变。AWS的能力正越来越显现出来,Amazon EC2可以说拥有最广泛的实例,而且AWS会根据客户的工作负载特征去量体裁衣,设计出满足客户需求的实例。不仅有每秒400Gbps的Amazon EC2 P4d Instances,还有最高内存24TB的Amazon EC2 High Memory instances for SAP HANA等,其还是唯一一家支持英特尔和AMD处理器的云服务商,同时自研ARM芯片,可以看到AWS正在切实的赋能客户。
四个改变游戏规则的新服务
在re:Invent首日发布了43项全新的服务和功能,其中有四款服务Andy认为它们是可以改变游戏规则的。
每一个微服务都有自己的管道,这些管道甚至由不同的团队在管理,所以它们实时都可能在发生变化。新发布的AWS Proton提供了更细粒度的开发和部署管理工具,简化容器和无服务器应用的开发和部署,而且是一个完全托管的服务。AWS Proton会提供指定的AWS服务,把代码通过CI/CD的管道做推送、编译、测试。
现在用户越来越需要使用无服务器架构来支持Amazon Aurora,Amazon Aurora Serverless v2是Amazon Aurora无服务器数据库的新版本,可以做到实时扩容,在不到1秒的时间内扩展至支持几十万个数据处理事务,开发者不需要按业务峰值进行容量配置,而是按需扩容,可节省90%的成本。
AWS Glue Elastic Views能够在组合存储里组合复制数据,实现更好的可视化的效果。它可以从多个不同数据源创建虚拟表(也叫实例化视图或物化视图),简单、高效地将数据孤岛连接起来,形成统一的数据视角,当数据源发生变化时能够在几秒钟内同步,让开发者的数据能够在所有的数据存储里自如地流动。
Amazon SageMaker Data Wrangler可以提高机器学习数据准备的速度,只需把Data Wrangler指向合适的AWS数据存储或第三方数据存储,Data Wrangler内置超过300种数据转换,可以自动识别数据类型,推荐合适的转换。它可以在控制面板合并、组合多个功能,可以在SageMaker Studio中预览数据转换,然后应用到整个数据集。
混合架构也有同样的云上体验
混合云也是被提出很久的议题,AWS也为希望混合部署的企业做了很多的尝试。现在2018年发布的AWS Outposts已经开始对外提供服务,这也是企业希望将云的能力推到自己的数据中心中,在本地利用云的弹性和管理,这也是AWS Outposts的设计初衷。
目前现在AWS Outposts已经有上千个用户,针对一些用量小的企业,今年也发布了1U和2U的机柜。AWS大中华区云服务产品管理总经理顾凡表示,它们可以支持64到268个VCPU,做分布式、大规模的部署和集中管理。
还有去年针对电影制作、渲染、游戏等企业发布的AWS Local Zone,让AWS计算,存储和数据库服务可以更靠近人员、行业和IT中心。今年AWS Local Zone也在洛杉矶之外开放了波士顿、休士顿和迈阿密三个地区,2021年还将推出12个新城市,包括芝加哥、达拉斯、明尼苏达、纽约、费城、波特兰和西雅图等。
AWS Local Zone可以理解为一个相对更迷你、更灵活的区域,同时它是用Outpost作为一个基准模块去部署,使Local Zone的上线会更快。而且其还可以无缝连接回AWS US West(俄勒冈州)区域或客户可能正在使用的其他AWS区域。
好文章,需要你的鼓励
ETH Zürich等机构研究人员提出TrustVLM框架,解决视觉-语言模型预测可信度问题。该方法利用模型中存在的"模态差距",创新性地结合图像到文本和图像到图像的相似度,实现无需重新训练即可大幅提升误分类检测性能。在17个数据集的严格测试中,TrustVLM相比现有方法在关键指标上提升显著,同时改善了零样本分类准确率。此成果为AI系统在自动驾驶、医疗等安全关键领域的可靠部署提供了重要保障。
这项研究提出了个性化安全概念,解决大语言模型对不同用户采用统一安全标准的问题。研究团队创建了PENGUIN基准测试集评估模型在处理高风险场景时的个性化安全能力,并开发了RAISE框架高效获取关键用户信息。实验表明,提供用户背景可使安全分数提高43.2%,而RAISE框架通过平均仅2.7次交互即可提高安全分数31.6%。这一创新方法将AI安全从"一刀切"转向"个性定制",为高风险领域的AI应用提供了新思路。
明尼苏达大学研究团队提出了一种创新方法,通过回合级信誉分配显著提升大语言模型(LLM)智能体的多回合推理能力。传统方法只对整个过程进行评价,而他们的MT-GRPO算法能够精确评估每个决策步骤的价值,就像为每一步提供具体反馈。在维基百科搜索工具使用场景中,该方法实现了100%的工具执行成功率和50%的答案精确匹配率,远超传统方法。这一突破不仅提高了AI在多步骤任务中的表现,也为开发更复杂的AI系统提供了重要思路。
这篇研究介绍了PISCES——一种能精确从大语言模型参数中移除特定概念知识的创新技术。与现有方法不同,PISCES通过解缠器模型识别概念相关特征,直接编辑模型参数,实现了更精准的知识移除。在Gemma和Llama模型上的测试表明,该方法不仅有效降低了目标概念的准确率(低至7.7%),还保持了模型在无关领域的高性能,并显著提高了对"重新学习"的抵抗力。这一突破为AI系统的安全部署和合规使用提供了新的可能性。