ZD至顶网CIO与应用频道 04月28日 北京消息:亚马逊公司(NASDAQ:AMZN)旗下的Amazon Web Services(AWS)宣布两个全新 Amazon Elastic Block Store (Amazon EBS) 低成本的硬盘 (HDD) 型存储选项上市,以大数据集、大输入/输出 (I/O) 块和序列 I/O 的模式,向客户提供面向吞吐量密集和大数据工作负载的可预测性能。Amazon EBS 吞吐量优化型 HDD (st1) 和 Amazon EBS 冷 HDD (sc1) 卷向客户交付始终一致的基线性能,并可“爆增”到更高吞吐量以便满足 MapReduce、Kafka、提取/转换与加载 (ETL)、日志处理和数据仓库工作负载性能需求。Amazon EBS 客户仅为他们占用的存储付费,没有额外吞吐量的费用。若要开始使用 Amazon EBS 吞吐量优化型 HDD (st1) 和冷 HDD (sc1) 卷,请访问:http://aws.amazon.com/ebs。
从 2008 年发布 Amazon EBS 以来,AWS 持续创新地提供块存储选项,以此支持客户优化工作负载的存储性能并降低成本。2012 年,AWS 开始提供包含固态硬盘 (SSD) 技术的 Amazon EBS 卷,交付用于延迟敏感型交易工作负载的高性能持久存储,例如数据库持续地要求每秒有大量的输入输出操作 (IOPS)。2014 年,AWS 发布了性价比优化的、基于 SSD 的存储服务,开创 IOPS“爆增”模式,高成本效益地交付各种交易型工作负载所需的 IOPS 性能,包括启动卷、开发/测试和低延迟交互式应用。通过新发布的产品,AWS 持续创新,交付面向大数据工作负载的、且拥有业界最佳性价比的块存储。作为AWS 基于 HDD 的新一代存储设计,这些 Amazon EBS 卷是为了面向吞吐量密集型、大数据工作负载(例如处理日志或 Kafka 流传输数据、MapReduce 执行集群数据分析、数据仓库)或面向较少访问的工作负载而优化的。Amazon EBS 吞吐量优化型 HDD (st1) 和冷 HDD (sc1) 卷交付具有可预测高吞吐量的、满足大数据应用处理需求所需的低成本 HDD 存储。吞吐量优化型 HDD (st1) 卷包括高达每卷每秒 500 MB的最大吞吐量,冷 HDD (sc1) 卷则有每卷每秒 250 MB 的最大吞吐量。所有的EBS 卷类型均可提供持久快照功能并且具有 99.999% 可用性。
亚马逊AWS计算服务副总裁Peter DeSantis表示,“过去数年,AWS 已交付一系列基于 SSD 的 Amazon EBS 卷,以此支持客户可以成功且高经济效益地运行 IOPS 最密集的应用。但是,对于大数据工作负载,HDD 仍是最佳块存储解决方案,然而却一直没有什么创新。但是,直到今天,这两个全新 Amazon EBS 卷已代表了 HDD 成本和性能方面的阶跃变化,而且可以支持更高效地运行吞吐量密集型、大数据工作负载。”
Localytics 是一个面向Web 和移动应用的生命周期支持平台,超过 27 亿个设备、37,000 多种app都在使用它的服务。Localytics 后台工程总监Mohit Dilawari表示,“我们的Vertica 集群上有数拍字节磁存储,我们一直在寻找改善性能和降低成本的方式。发布的 Amazon EBS 冷 HDD (sc1) 支持我们迁移 Vertica 集群,节省月存储成本 50% 以上,同时还提供我们运行查询所需的可靠吞吐量。更大卷规模还无需组合多个卷,以此简化集群管理和操作、同时支持更方便地扩展。”
Infor 向超过 73,000 个客户和 5,800 万云用户提供行业专用和面向云而构建的商业软件。Infor 云服务副总裁Jim Plourde表示,“我们对发布 Amazon EBS 吞吐量优化型 HDD (st1) 和冷 HDD (sc1) 感到非常兴奋,期望利用卷降低成本、向吞吐量优化型 HDD (st1) 迁移一些大数据工作负载并且向冷 HDD (sc1) 迁移更冷数据。向冷 HDD (sc1) 迁移我们的更冷数据,能够节省大量存储成本。”
Apache Kafka创建的 Confluent 支持组织从流数据实现商业价值。Confluent 联合创始人和首席执行官Jay Kreps表示,“从我们运行不同的高吞吐量工作负载的基准测试中,我们发现全新 Amazon EBS 吞吐量优化型 HDD (st1) 和冷 HDD (sc1) 卷始终一致地交付运行 Kafka 必需的吞吐量、性能和可靠性。新卷可为客户节省高达 50% 的 Amazon EBS 存储并为 Kafka 提供相同吞吐量和性能。此外,新卷为在 AWS 上运行 Kafka 的客户提供更多选项。因为客户能够使用低成本实例,例如 Amazon EC2 C4 或 M4,借助这些 Amazon EBS 新卷优化性能并降低成本。”
客户可利用 AWS 管理控制台、AWS 命令行界面 (CLI) 或 AWS 软件开发包 (SDK) 启动 Amazon EBS 吞吐量优化型 HDD (st1) 和冷 HDD (sc1) 卷。Amazon EBS 吞吐量优化型 HDD (st1) 和 Amazon EBS 冷 HDD (sc1) 卷已在全部商用的 AWS 区域上市。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。