可信的数据、分析和AI混合平台厂商肯睿Cloudera今天宣布与AI数据云公司Snowflake集成,为企业提供由Apache Iceberg支持、开放且统一的混合数据湖库。两家公司强强联手,利用双方在数据采集、处理和使用方面的创新工具,为企业提供涵盖数据、分析和AI工作负载的单一可信来源。
数据是企业的强大资产,能够推动明智决策,带来竞争优势并发掘创新机遇。2022年的一项研究显示,80%的企业凭借实时数据分析提高了收入,98%的企业利用数据提高了客户的好感度。但要充分发挥数据的力量,企业需要单一且统一的可信来源,用于存储、管理和治理位于各个地点的企业数据。
Cloudera已将其开放数据湖库的互通性扩展到Snowflake,支持双方客户通过Apache Iceberg REST目录无缝访问Cloudera的数据湖库。凭借由Apache Iceberg支持的优化数据平台,客户能够使用先进工具采集、准备并处理其数据。此外,Snowflake用户现在可以直接从Snowflake查询存储在Cloudera Ozone(与 AWS S3 兼容的本地对象存储解决方案)上的数据。客户可以通过连贯协作、本地、平台即服务(PaaS)和软件即服务(SaaS)的方式访问所有主要的数据存储形态。
除了提高两个系统之间的互通性外,Cloudera客户还将体验到Snowflake商业智能引擎带来的便利。Snowflake引擎无需复制或传输数据,即可访问Cloudera开放数据湖库数据。既降低了复杂性,简化了操作,同时又保持了数据的完整性。
此外,此次合作还降低了企业集成堆栈的总体拥有成本。这主要是因为消除了数据和元数据孤岛,合理规划了数据管道,并且简化了操作。上述改进有助于提高大规模数据分析和AI用例的效率,进一步增加了企业同时使用Cloudera 和 Snowflake解决方案获得的价值。此次战略集成不仅优化了数据分析工作流程,还为企业提供了一个既能推动创新、又能在各自市场获得竞争优势的强大框架。
此次集成的其他优势包括:
● 可管理的Iceberg表:Iceberg表提高了数据性能和可靠性。无论数据存储在何处,双方客户都能通过更合理的安排、更快的查询速度和经过简化的数据管理流程,发掘数据潜力。
● 先进引擎:双方客户借助先进的引擎采集、准备和管理其数据,从而无缝管理AI和商业智能工作负载。
● 统一的安全措施和治理:此次集成整合了整个数据生命周期内的数据安全措施和治理。双方客户可以采用一致的安全措施,追踪数据来源和移动,并在一个平台内管理位于本地或云端的元数据。
Cloudera首席战略官Abhas Ricky表示: “通过Apache Iceberg将我们的开放数据湖库功能扩展到Snowflake,我们不但能够支持客户优化其数据工作流程,同时还为其带来了推动创新、提升效率和促进业务发展的新机遇。此次合作将帮助客户简化数据架构,尽可能减少数据管道的数量,降低数据资产的总体拥有成本以及安全风险。Snowflake和Cloudera将一同为现代化企业开辟一个由数据驱动决策的新时代。”
Snowflake技术联盟主管Tarik Dwiek表示: “追求开放数据标准的客户将Apache Iceberg作为其首选,而Cloudera一直是Iceberg项目不可或缺的一部分。我们的合作为选择在Iceberg表上实现标准化的客户带来了新的可能性。我们十分高兴能够打破数据孤岛,并为客户提供具有多种分析功能的统一混合数据云体验。”
SanjMo分析师Sanjeev Mohan表示: “通过双方合作,客户可以访问一个统一而强大的数据管理平台。该平台将成为客户数据的单一可信来源,无论数据位于云端,还是本地。这样,客户就能够简化数据操作,并保证数据操作的安全性。同时在整个数据生命周期(从数据采集到数据分析和AI)内提供高效数据分析,并提炼数据洞察。两大行业巨头的战略合作将为企业带来更多价值。”此外,为了加强我们推广Iceberg的力度,Cloudera推出Cloudera Lakehouse Optimizer技术预览版。这项新服务能够自主优化客户的Iceberg表,在进一步降低成本的同时,显著提高客户的数据湖库性能。
好文章,需要你的鼓励
Gartner预测,到2030年所有IT工作都将涉及AI技术的使用,这与目前81%的IT工作不使用AI形成鲜明对比。届时25%的IT工作将完全由机器人执行,75%由人类在AI辅助下完成。尽管AI将取代部分入门级IT职位,但Gartner认为不会出现大规模失业潮,目前仅1%的失业由AI造成。研究显示65%的公司在AI投资上亏损,而世界经济论坛预计AI到2030年创造的就业机会将比消除的多7800万个。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
人工智能正从软件故事转向AI工厂基础,芯片、数据管道和网络协同工作形成数字化生产系统。这种新兴模式重新定义了性能衡量标准和跨行业价值创造方式。AI工厂将定制半导体、低延迟结构和大规模数据仪器整合为实时反馈循环,产生竞争优势。博通、英伟达和IBM正在引领这一转变,通过长期定制芯片合同和企业遥测技术,将传统体验转化为活跃的数字生态系统。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。