Gartner发布影响中国数智基建市场的三大重要趋势。根据Gartner预测,到2028年,50%构建于2023年之前的中国数据和分析(D&A)平台,将因为与生态系统脱钩而过时;此外,到2028年,在中国开展跨境业务的企业机构(包括出海企业和外资企业),如果不能简化其互联云/混合云的数据管理,其所有D&A成果的洞察交付时间将延长一倍。
面对经济不确定性和人工智能(AI)的快速发展,中国的企业机构比以往任何时候都要更强调其数智基建的直接投资回报率(ROI)和适应性。中国的D&A领导者在考虑数智基建的建设方法时,应将重点转向构建数据、分析和AI生态系统。
Gartner高级研究总监顾星宇表示:“宏观经济和地缘政治不确定性持续存在。同时,由于当今的分析和AI技术十分复杂,许多与数据管理相关的组件正在快速演进。在这些背景下,中国的D&A领导者在实施D&A解决方案和选择供应商时,应转变思维,以生态系统为中心,应对市场变动。”
Gartner研究显示,以下三大趋势对中国数智基建市场有重要影响。
图1:影响中国数智基建市场的主要趋势
缩短价值实现时间,提高技术稳健性
在过去十年中,大多数的数据中台供应商同时扮演了服务提供商的角色,帮助客户开发D&A用例。但这种一人饰多角的合作方式,也稀释了厂商对核心技术持续研发的能力。问询显示,2023年中国企业机构越来越担心他们的D&A厂商无法持续维持和改进日益复杂的数智基建技术。
Gartner高级研究总监顾星宇表示:“在继续创新数据库、数据集成和数据治理等核心技术的同时,中国数智基建供应商已开始与行业SaaS供应商或服务商合作,将其技术嵌入合作伙伴的行业解决方案中。这一方法极大地缩短了D&A投资的价值实现时间,使企业可以在时间和预算均十分有限的情况下,启动针对特定业务用例的D&A实践。与此同时,由数智基建供应商为相关应用的数据管理技术提供支持,可确保企业未来能够适应不断变化的新技术需求。”
增强互联云/混合云数据管理的合规性和资源效率
在部署D&A应用方面,中国企业比世界其他地区的企业所面临的云环境更为复杂。在这种情况下,只能与一种环境兼容的D&A平台不再满足各企业机构对各自D&A资产进行有效且合规管理的需求。
Gartner高级研究总监顾星宇表示:“中国的数智基建供应商正在加快与多个云供应商建立合作伙伴关系,以确保其解决方案在各种云环境中都能够实现最大能力。同时,通过提供自动互联云资源优化和自动数据属地管理等功能,这些供应商可以帮助企业提高跨云数据管理的效率和合规性。”
使用AI就绪型数据支持GenAI应用
Gartner调研显示中国企业对生成式人工智能(GenAI)应用存在三大担忧:
Gartner高级研究总监顾星宇表示:“如何解决这些问题取决于企业如何为其GenAI应用构建AI就绪型数据。中国的数智基建供应商正在对数据安全和质量管理、数据语义层以及元数据管理等功能进行创新,确保为客户提供可靠的底座。数智基建所提供的能力也将在解决幻觉方面发挥至关重要的作用。同时,数智基建可以帮助企业避免模型或云锁定。
好文章,需要你的鼓励
P1.AI创始人保罗·埃雷门科正用合成数据训练AI设计物理系统,从住宅冷却到星际飞船,突破工程AGI的终极瓶颈——数据稀缺。他的AI工程师Archie已能像人类一样处理多物理场任务,目标是让机器设计人类无法想象的复杂系统。
波士顿大学研究团队开发的DORI基准测试从四个维度评估多模态大语言模型的物体方向理解能力:正面对齐、旋转变换、相对方向和规范方向感知。研究评估了15个最先进模型,发现即使最佳模型在粗粒度任务上的准确率也仅为54.2%,在细粒度方向判断上更低至33.0%,与人类表现相差近30%。结果表明当前模型在精确角度估计、多视角追踪和理解复合旋转方面存在系统性缺陷,反映了它们内部3D空间表示的根本局限,为未来模型设计提供了明确方向。
这篇研究介绍了Oracle AI团队开发的一种针对企业系统的域特定检索硬负样本挖掘框架。该方法通过整合多种嵌入模型、降维处理和独特的语义选择标准,动态识别具有挑战性但上下文无关的文档作为训练样本,显著提升了重排序模型的性能。在云服务领域的测试中,该方法在MRR@3和MRR@10指标上分别提升了15%和19%,并在多个公开领域数据集上展示了广泛适用性,为企业搜索和检索增强生成应用提供了实用解决方案。
Oracle研究团队开发了FS-DAG,这是一种用于视觉丰富文档理解的少样本领域适应图网络模型。与传统大型模型不同,FS-DAG仅需5份示例文档即可适应新文档类型,参数量不到90M,却在信息提取任务中表现卓越。模型采用模块化架构,结合预训练的文本和视觉特征提取器与图神经网络,展现出对OCR错误的极强鲁棒性(性能下降不到1%)。实验表明,FS-DAG在多种文档类型上优于LayoutLMv2等大型模型,同时具有更短的训练和推理时间。目前已被50多家企业采用,每月处理超过100万次API调用,证明了其在实际业务场景中的价值。