由于新冠疫情,今年的亚马逊re:Invent也首次来到线上,并且第一次免费向全球开放。和往年一样AWS CEO Andy Jassy首先带来了最新的财务状况披露,AWS 2020年第三季度年化收入460亿美元,同比增长29%,实现100亿美元的增长。
AWS CEO Andy Jassy
AWS每增长100亿美元的时间正在逐渐缩短,实现第一个100亿美元收入用了123个月,第二个100亿美元增长用了23个月,第三个100亿美元增长用了13个月,第四个100亿美元增长用了12个月。
疫情会造成一些业务的停顿,在这期间所有企业都在尽可能的节约成本,同时疫情期间企业也更多开始用云来开展业务,疫情推动云计算市场至少几年的发展速度。在Andy看来,“我们很难打造一个长期可持续性的企业,所以我们要不断地重塑,再造自己,才能够生存下来。”
在过去的9个月中,Andy思考了很多企业重塑的问题,企业需要去校准自己,而不是别人追着你让你去改变。AWS的能力正越来越显现出来,Amazon EC2可以说拥有最广泛的实例,而且AWS会根据客户的工作负载特征去量体裁衣,设计出满足客户需求的实例。不仅有每秒400Gbps的Amazon EC2 P4d Instances,还有最高内存24TB的Amazon EC2 High Memory instances for SAP HANA等,其还是唯一一家支持英特尔和AMD处理器的云服务商,同时自研ARM芯片,可以看到AWS正在切实的赋能客户。
四个改变游戏规则的新服务
在re:Invent首日发布了43项全新的服务和功能,其中有四款服务Andy认为它们是可以改变游戏规则的。
每一个微服务都有自己的管道,这些管道甚至由不同的团队在管理,所以它们实时都可能在发生变化。新发布的AWS Proton提供了更细粒度的开发和部署管理工具,简化容器和无服务器应用的开发和部署,而且是一个完全托管的服务。AWS Proton会提供指定的AWS服务,把代码通过CI/CD的管道做推送、编译、测试。
现在用户越来越需要使用无服务器架构来支持Amazon Aurora,Amazon Aurora Serverless v2是Amazon Aurora无服务器数据库的新版本,可以做到实时扩容,在不到1秒的时间内扩展至支持几十万个数据处理事务,开发者不需要按业务峰值进行容量配置,而是按需扩容,可节省90%的成本。
AWS Glue Elastic Views能够在组合存储里组合复制数据,实现更好的可视化的效果。它可以从多个不同数据源创建虚拟表(也叫实例化视图或物化视图),简单、高效地将数据孤岛连接起来,形成统一的数据视角,当数据源发生变化时能够在几秒钟内同步,让开发者的数据能够在所有的数据存储里自如地流动。
Amazon SageMaker Data Wrangler可以提高机器学习数据准备的速度,只需把Data Wrangler指向合适的AWS数据存储或第三方数据存储,Data Wrangler内置超过300种数据转换,可以自动识别数据类型,推荐合适的转换。它可以在控制面板合并、组合多个功能,可以在SageMaker Studio中预览数据转换,然后应用到整个数据集。
混合架构也有同样的云上体验
混合云也是被提出很久的议题,AWS也为希望混合部署的企业做了很多的尝试。现在2018年发布的AWS Outposts已经开始对外提供服务,这也是企业希望将云的能力推到自己的数据中心中,在本地利用云的弹性和管理,这也是AWS Outposts的设计初衷。
目前现在AWS Outposts已经有上千个用户,针对一些用量小的企业,今年也发布了1U和2U的机柜。AWS大中华区云服务产品管理总经理顾凡表示,它们可以支持64到268个VCPU,做分布式、大规模的部署和集中管理。
还有去年针对电影制作、渲染、游戏等企业发布的AWS Local Zone,让AWS计算,存储和数据库服务可以更靠近人员、行业和IT中心。今年AWS Local Zone也在洛杉矶之外开放了波士顿、休士顿和迈阿密三个地区,2021年还将推出12个新城市,包括芝加哥、达拉斯、明尼苏达、纽约、费城、波特兰和西雅图等。
AWS Local Zone可以理解为一个相对更迷你、更灵活的区域,同时它是用Outpost作为一个基准模块去部署,使Local Zone的上线会更快。而且其还可以无缝连接回AWS US West(俄勒冈州)区域或客户可能正在使用的其他AWS区域。
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。