Gartner公司发布了 2025年数据和分析(D&A)重要趋势,这些趋势正在催生包括企业和人员管理等方面的一系列挑战。
Gartner研究副总裁孙鑫(Julian Sun)表示:“D&A正在从一个小众领域走向普及。与此同时,D&A领导者面临的压力已经从‘资源少,事情多’变成了‘资源多,事情更多’,而且这项工作由于风险的增加而变得更具挑战性。不过,有一些趋势将帮助D&A领导者应对他们所面临的压力、期望和需求。”
趋势1:高消耗数据产品
为了充分利用高消耗数据产品,D&A领导者应重点关注关键业务用例,通过产品关联和规模化来减少数据交付方面的挑战,优先交付可重复使用和可组合的最小可行数据产品,以便让团队不断改进这些产品。同时,D&A领导者还必须在数据生产和使用团队之间就关键绩效指标达成共识,这对于衡量数据产品的成功至关重要。
趋势2:元数据管理解决方案
有效的元数据管理应先从技术元数据出发,然后扩展到业务元数据以增强上下文。通过整合各种类型的元数据,企业能够实现数据目录、数据脉络和AI用例。因此,选择有助于自动发现和分析元数据的工具势在必行。
趋势3:多模态数据编织
建立强大的元数据管理实践涉及获取和分析整个数据管道中的元数据。数据编织提供的洞察和自动化可满足编排需求、通过数据运维(DataOps)实现更卓越的运营,并最终实现数据产品。
趋势4:合成数据
识别缺失、不完整或获取成本高的数据对于推进AI行动至关重要。合成数据既可以作为原始数据的变体,也可以替代敏感数据,能够在促进AI发展的同时保护数据隐私。
趋势5:代理式分析
使用AI智能体进行数据分析,完成业务成果的自动化闭环具有变革性意义。Gartner建议尝试开发自然语言接口连接业务洞察的用例,并评估供应商的数字化工作场所应用集成路线图。同时,建立治理机制可最大程度地减少错误和幻觉,并且通过AI就绪数据原则评估数据就绪度十分重要。
趋势6:AI代理
AI代理对于满足临时的、灵活的或复杂的自适应自动化需求至关重要。企业不能仅仅依赖大语言模型(LLM),还需要采用其他形式的分析和AI技术。D&A领导者应使AI代理能够无缝访问和共享所有应用的数据。
趋势7:小语言模型
相比大语言模型,Gartner更推荐企业考虑使用小语言模型,以便在特定领域获得更加准确、更符合语境的AI输出结果。Gartner建议提供用于检索增强生成或微调自定义领域模型的数据,特别是在本地使用时,可以处理敏感数据并减少计算资源和成本。
趋势8:复合型AI
多种AI技术的结合可提高AI的影响力和可靠性。D&A团队不应局限于GenAI和LLM(大语言模型),还应整合数据科学、机器学习、知识图谱以及优化等技术,以实现全面的AI解决方案。
趋势9:决策智能平台
从数据驱动到以决策为中心的转变至关重要。Gartner建议采取的步骤包括:优先考虑急需建模的业务决策、调整决策智能(DI)实践、评估DI平台。成功的关键在于重新发掘数据科学技术并解决决策自动化的道德、法律和合规问题。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。