在近期举办的Veeam大会上,富达投资和安永的企业AI实践负责人分享了亲身经历:AI部署初期,大量长期被忽视的非结构化历史数据(如SharePoint文件、PDF报告)因AI的强大检索能力突然浮出水面,引发数据安全隐患,迫使企业临时叫停AI推进计划。专家指出,问题根源不在于AI本身,而在于数据治理缺失。建立数据所有权体系、精细化标签管理及完善的AI使用监控机制,是企业AI稳健落地的关键所在。
Denodo宣布与亚马逊云科技(AWS)推出一系列集成,将Denodo平台与Amazon Bedrock AgentCore、Amazon SageMaker及Amazon QuickSight深度整合,为企业在混合云和多云环境中部署智能体AI构建可信数据基础。此举旨在解决AI项目因数据质量不足、访问受限或治理缺失而难以落地的痛点,帮助银行、医疗、制造等行业在满足数据合规要求的同时,推动AI从概念验证走向规模化应用。
被Salesforce收购后,Informatica发布重大更新,推出"无头"版旗舰产品智能数据管理云(IDMC),通过MCP端点和可复用服务供AI智能体直接调用,支持Claude、Slack、Cursor等主流AI框架。同时推出业界首个统一"智能体与上下文目录",实现数据资产与AI智能体的统一治理。此外,公司还发布数据质量智能体、元数据增强智能体等新工具,并深化与谷歌、微软、Snowflake、AWS、Databricks等合作伙伴的集成。
根据邓白氏最新AI动态调查,97%的企业正在推进AI项目,但仅有5%表示其数据已具备支撑AI规模化落地的条件。67%的企业已看到初步投资回报,24%报告了显著收益。然而,数据访问限制、隐私合规风险及数据质量问题仍是主要障碍。专家指出,从试点到规模化部署,企业需要高质量、可治理的数据基础设施,尤其在智能体AI逐步进入生产环境的背景下,数据就绪能力已成为关键。
企业AI架构正面临一场深层危机:依赖数据管道、RAG层、向量数据库和编排框架的传统方式,在智能体规模化生产中频频失效。数据每经一次流转,治理策略就面临一次失效风险,由此形成隐性的"流水线税"——导致AI项目延期、幻觉频发、审计困难。解决之道在于重构架构逻辑:不再搬移数据,而是将AI与治理能力直接内嵌于数据层,实现实时、主权化的统一管控。
随着AI深度融入政府、金融、能源等关键领域,海湾合作委员会(GCC)各国正将数据主权从合规要求升级为核心战略。Accelera Digital Group巴林区负责人Mohammed Ashoor指出,数据主权不仅是"数据是否在国内"的问题,更关乎数据的治理、保护与价值创造。企业需在本地合规与超大规模云基础设施之间寻求平衡,采用"混合治理"模式。他同时警告,过度集中基础设施可能带来运营脆弱性,需构建"主权韧性"架构以应对风险。
随着AI模型的法律风险从理论走向现实,训练数据的管理方式正在发生根本性转变。过去,数据被视为低成本输入,来源记录模糊。如今,诉讼案件增多、监管趋严,迫使企业重新审视数据的合规性与可溯源性。质量不佳或权属不清的数据集,可能导致模型重训、市场准入受限及声誉损失。AI团队开始像评估资本支出一样评估训练数据——关注其生命周期价值、法律风险与长期复用潜力。
丰田汽车欧洲公司企业数据与分析主管蒂埃里·马丁分享了他从汽车工程师转向数据领域的职业历程。在过去几年中,马丁从零开始构建了公司的数据平台,以Snowflake云技术为核心,打造企业级数据网格。该平台已推出100个数据产品,覆盖300-400个数据项目。马丁强调数据质量和治理的重要性,并探索AI在制造流程优化中的应用,致力于通过数据驱动提升业务效率。
数据治理公司Bedrock Data获得云数据仓库巨头Snowflake战略投资,将深化与AI数据云的集成。双方将整合AI驱动的数据分类和治理能力至Snowflake Horizon服务中。新推出的ArgusAI与Snowflake Cortex AI集成,可帮助企业在增强治理的同时降低风险。该集成解决了79%企业在AI系统中难以分类敏感数据的问题,提供PB级数据发现、分类和权限分析能力。
Autorek最新报告显示,保险业内部流程存在运营阻力,影响AI有效实施。调研250名英美管理者发现,82%企业预期AI将主导行业,但仅14%完全整合AI运营。主要障碍包括遗留系统集成、数据碎片化和内部专业知识不足。企业平均管理17个数据源,数据分散严重影响治理框架。报告建议优先在对账流程中试点AI应用,并采用云端AI平台解决数据结构化问题,为规模化自动化奠定基础。
一项针对600名首席数据官的调查显示,收入超过5亿美元的企业中,69%已在运营中使用生成式AI,较2025年的48%大幅增长。尽管AI采用率上升,但数据和AI素养仍是关注焦点。75%的CDO认为员工需要提升数据素养,74%认为需要提升AI素养。报告发现,47%的企业已采用AI智能体,86%的CDO计划在2026-2027年增加数据管理投资。
研究显示AI应用仍不均衡,虽然许多组织正在尝试包括数据科学、机器学习、生成式AI和智能代理AI在内的技术,但企业级部署仍低于50%。仅有约四分之一的受访者表示AI是2025年底业务战略的主要驱动因素,但这一数字较上半年翻了一倍多。55%的组织报告AI影响战略规划但尚未成为核心。数据成熟度是扩展AI的主要瓶颈。
斯坦福2025年AI指数报告显示,2024年AI相关安全事件激增56.4%。数据泄露已非"是否发生"而是"何时发生"的问题。有效数据治理的关键在于战略性降低风险并做好应对准备。五大策略包括:制定主动行动计划、紧跟法规标准、快速响应、保持透明度、了解法律责任。IBM报告显示企业平均需181天发现泄露、60天控制事件,24-48小时内控制的泄露影响和成本大幅降低。
日立的数据基础设施研究显示,数据管理、治理和安全方面的缺陷正在拖累AI项目进展。该公司2025年全球数据基础设施报告指出,企业虽然投资AI项目,却被数据基础设施不足所制约。研究调查了15个国家的1244名高管,提出数据基础成熟度模型,包括新兴、明确和优化三个阶段。报告发现89%的优化型组织采用高可用性设计和AI驱动运营,而新兴组织仅占20%。薄弱的数据基础使企业面临更高风险。
与传统数据集不同,AI生成的内容和洞察往往存在于真空中,缺乏适当的治理而被创建、使用和视为理所当然。对于没有提供适当监督和主动治理AI数据的公司,它们容易面临法律合规问题、知识产权风险、数据来源漏洞等不可见风险。企业需要建立最佳实践来治理AI数据的使用,包括标记、溯源、存储和建立问责制。关键策略包括集中数据源、消除孤岛、重视AI治理文化,以及严格标记AI输出。
Gartner最新研究显示,随着企业对生成式AI投入增加,未来大语言模型面临基于先前模型输出进行训练的风险,可能导致模型崩溃。为应对AI生成数据泛滥带来的挑战,企业需采用零信任数据治理方式。Gartner建议任命AI治理负责人、加强跨部门协作、更新安全和数据管理政策。预计到2028年,50%的组织将因未验证AI生成数据而采用零信任数据治理策略。
2025年一系列大规模云服务故障暴露了过度集中化的风险,同时企业无节制使用公共AI工具正在防火墙外创建影子数据副本。2026年企业将采取混合云策略,将应用和数据复制到本地环境和多个云平台中,同时将AI交互拉回到受管理的内部环境,确保数据治理和合规性,重新获得对最宝贵资产的绝对控制权。
技术分析机构Gartner指出,AI数据正面临经典的"垃圾进垃圾出"问题。组织的AI系统和大语言模型被大量未经验证的AI生成内容淹没,这些内容不可信赖。AI垃圾内容用虚假数据毒害大语言模型,导致"模型崩溃"现象。Gartner预测到2028年,50%的组织将对数据治理采用零信任态度。企业不能再默认数据是人类生成或可信的,必须验证、认证并跟踪数据来源以保护业务成果。
随着AI发展推动数据治理受到企业高层重视,主数据管理成为构建可信数据视图的核心。本文提出四大最佳实践:采用程序化方法明确业务目标和成功指标;建立业务驱动的协作治理团队,明确角色职责;选择适合的技术供应商并采用分阶段实施方式;保持对核心主数据的专注识别。通过在流程、人员、技术和数据层面严格应用这些实践,企业可建立强大可扩展的主数据管理体系。
就像维护高质量草坪需要持续的水分和养分供应一样,企业的成功也依赖于数据的流动性和可用性。2026年Salesforce CIO趋势报告显示,96%的CIO计划利用智能AI构建高性能组织。数据就是企业的养分和水源,但静止的数据如同停滞的水会变质。Gartner研究表明,80%寻求数字化扩展的组织因缺乏现代数据治理方法而失败。企业需要打破数据孤岛,建立类似灌溉系统的数据流动机制,确保信息实时流转,为AI智能体提供清洁数据支持,实现自主增长。