可信的数据、分析和AI混合平台厂商肯睿Cloudera今天宣布与AI数据云公司Snowflake集成,为企业提供由Apache Iceberg支持、开放且统一的混合数据湖库。两家公司强强联手,利用双方在数据采集、处理和使用方面的创新工具,为企业提供涵盖数据、分析和AI工作负载的单一可信来源。
数据是企业的强大资产,能够推动明智决策,带来竞争优势并发掘创新机遇。2022年的一项研究显示,80%的企业凭借实时数据分析提高了收入,98%的企业利用数据提高了客户的好感度。但要充分发挥数据的力量,企业需要单一且统一的可信来源,用于存储、管理和治理位于各个地点的企业数据。
Cloudera已将其开放数据湖库的互通性扩展到Snowflake,支持双方客户通过Apache Iceberg REST目录无缝访问Cloudera的数据湖库。凭借由Apache Iceberg支持的优化数据平台,客户能够使用先进工具采集、准备并处理其数据。此外,Snowflake用户现在可以直接从Snowflake查询存储在Cloudera Ozone(与 AWS S3 兼容的本地对象存储解决方案)上的数据。客户可以通过连贯协作、本地、平台即服务(PaaS)和软件即服务(SaaS)的方式访问所有主要的数据存储形态。
除了提高两个系统之间的互通性外,Cloudera客户还将体验到Snowflake商业智能引擎带来的便利。Snowflake引擎无需复制或传输数据,即可访问Cloudera开放数据湖库数据。既降低了复杂性,简化了操作,同时又保持了数据的完整性。
此外,此次合作还降低了企业集成堆栈的总体拥有成本。这主要是因为消除了数据和元数据孤岛,合理规划了数据管道,并且简化了操作。上述改进有助于提高大规模数据分析和AI用例的效率,进一步增加了企业同时使用Cloudera 和 Snowflake解决方案获得的价值。此次战略集成不仅优化了数据分析工作流程,还为企业提供了一个既能推动创新、又能在各自市场获得竞争优势的强大框架。
此次集成的其他优势包括:
● 可管理的Iceberg表:Iceberg表提高了数据性能和可靠性。无论数据存储在何处,双方客户都能通过更合理的安排、更快的查询速度和经过简化的数据管理流程,发掘数据潜力。
● 先进引擎:双方客户借助先进的引擎采集、准备和管理其数据,从而无缝管理AI和商业智能工作负载。
● 统一的安全措施和治理:此次集成整合了整个数据生命周期内的数据安全措施和治理。双方客户可以采用一致的安全措施,追踪数据来源和移动,并在一个平台内管理位于本地或云端的元数据。
Cloudera首席战略官Abhas Ricky表示: “通过Apache Iceberg将我们的开放数据湖库功能扩展到Snowflake,我们不但能够支持客户优化其数据工作流程,同时还为其带来了推动创新、提升效率和促进业务发展的新机遇。此次合作将帮助客户简化数据架构,尽可能减少数据管道的数量,降低数据资产的总体拥有成本以及安全风险。Snowflake和Cloudera将一同为现代化企业开辟一个由数据驱动决策的新时代。”
Snowflake技术联盟主管Tarik Dwiek表示: “追求开放数据标准的客户将Apache Iceberg作为其首选,而Cloudera一直是Iceberg项目不可或缺的一部分。我们的合作为选择在Iceberg表上实现标准化的客户带来了新的可能性。我们十分高兴能够打破数据孤岛,并为客户提供具有多种分析功能的统一混合数据云体验。”
SanjMo分析师Sanjeev Mohan表示: “通过双方合作,客户可以访问一个统一而强大的数据管理平台。该平台将成为客户数据的单一可信来源,无论数据位于云端,还是本地。这样,客户就能够简化数据操作,并保证数据操作的安全性。同时在整个数据生命周期(从数据采集到数据分析和AI)内提供高效数据分析,并提炼数据洞察。两大行业巨头的战略合作将为企业带来更多价值。”此外,为了加强我们推广Iceberg的力度,Cloudera推出Cloudera Lakehouse Optimizer技术预览版。这项新服务能够自主优化客户的Iceberg表,在进一步降低成本的同时,显著提高客户的数据湖库性能。
好文章,需要你的鼓励
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。