Gartner公司发布了 2025年数据和分析(D&A)重要趋势,这些趋势正在催生包括企业和人员管理等方面的一系列挑战。
Gartner研究副总裁孙鑫(Julian Sun)表示:“D&A正在从一个小众领域走向普及。与此同时,D&A领导者面临的压力已经从‘资源少,事情多’变成了‘资源多,事情更多’,而且这项工作由于风险的增加而变得更具挑战性。不过,有一些趋势将帮助D&A领导者应对他们所面临的压力、期望和需求。”
趋势1:高消耗数据产品
为了充分利用高消耗数据产品,D&A领导者应重点关注关键业务用例,通过产品关联和规模化来减少数据交付方面的挑战,优先交付可重复使用和可组合的最小可行数据产品,以便让团队不断改进这些产品。同时,D&A领导者还必须在数据生产和使用团队之间就关键绩效指标达成共识,这对于衡量数据产品的成功至关重要。
趋势2:元数据管理解决方案
有效的元数据管理应先从技术元数据出发,然后扩展到业务元数据以增强上下文。通过整合各种类型的元数据,企业能够实现数据目录、数据脉络和AI用例。因此,选择有助于自动发现和分析元数据的工具势在必行。
趋势3:多模态数据编织
建立强大的元数据管理实践涉及获取和分析整个数据管道中的元数据。数据编织提供的洞察和自动化可满足编排需求、通过数据运维(DataOps)实现更卓越的运营,并最终实现数据产品。
趋势4:合成数据
识别缺失、不完整或获取成本高的数据对于推进AI行动至关重要。合成数据既可以作为原始数据的变体,也可以替代敏感数据,能够在促进AI发展的同时保护数据隐私。
趋势5:代理式分析
使用AI智能体进行数据分析,完成业务成果的自动化闭环具有变革性意义。Gartner建议尝试开发自然语言接口连接业务洞察的用例,并评估供应商的数字化工作场所应用集成路线图。同时,建立治理机制可最大程度地减少错误和幻觉,并且通过AI就绪数据原则评估数据就绪度十分重要。
趋势6:AI代理
AI代理对于满足临时的、灵活的或复杂的自适应自动化需求至关重要。企业不能仅仅依赖大语言模型(LLM),还需要采用其他形式的分析和AI技术。D&A领导者应使AI代理能够无缝访问和共享所有应用的数据。
趋势7:小语言模型
相比大语言模型,Gartner更推荐企业考虑使用小语言模型,以便在特定领域获得更加准确、更符合语境的AI输出结果。Gartner建议提供用于检索增强生成或微调自定义领域模型的数据,特别是在本地使用时,可以处理敏感数据并减少计算资源和成本。
趋势8:复合型AI
多种AI技术的结合可提高AI的影响力和可靠性。D&A团队不应局限于GenAI和LLM(大语言模型),还应整合数据科学、机器学习、知识图谱以及优化等技术,以实现全面的AI解决方案。
趋势9:决策智能平台
从数据驱动到以决策为中心的转变至关重要。Gartner建议采取的步骤包括:优先考虑急需建模的业务决策、调整决策智能(DI)实践、评估DI平台。成功的关键在于重新发掘数据科学技术并解决决策自动化的道德、法律和合规问题。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。