Gartner公司发布了2024年数据与分析(D&A)重要趋势,这些趋势正在带来包括组织、人事问题在内的各种挑战。
Gartner高级研究总监方琦表示:“AI的力量以及日益重要的生成式AI正在改变人们的工作方式、团队协作方式和流程运作方式。在这场技术变革中,未能成功实现转型并有效利用D&A,特别是无法有效利用AI的企业机构,将难以取得成功。”
在近日的Gartner数据与分析峰会上,Gartner分析师介绍了IT领导者必须把握并纳入其D&A战略的重要数据与分析趋势(见图一)。
图一、2024年数据与分析重要趋势

资料来源:Gartner(2024年4月)
趋势 1:押注业务
随着AI不断推进各行各业战略层面上的变革,D&A领导者必须展现出“押注AI业务”的技能并赢得信任,才能领导企业内部的AI战略。
方琦表示:“D&A领导者必须将他们正在开发的能力与其为了实现企业机构所需业务成果所做的工作挂钩,以此展示他们对企业机构的价值。如果做不到这一点,那么资源分配不当、投资利用不足等问题将继续升级,企业机构也不会将领导内部AI战略的重任交给D&A。”
由于AI正在改变企业的运营方式,企业将面临一场成本灾难。D&A领导者必须采取行动落实财务运营(FinOps)实践,以此建立和执行标准并减少支出。
Gartner预测,到 2026 年,如果首席数据和分析官(CDAO)能够成为首席财务官在创造业务价值方面值得信赖的顾问和合作伙伴,那么D&A将升级为推动企业战略增长的动力。
趋势2:可管理的复杂性
许多D&A系统都很脆弱,并且它们的冗余会造成混乱和增加成本。方琦表示;“领先的企业正在努力将这种混乱转化为可管理的复杂性。复杂性本质上不易应对,但认识到这一点能够切实了解环境的动态变化,帮助D&A团队采取适当的行动。”
为了管理复杂性,D&A领导者需要利用AI工具实现生产自动化和提高生产力,包括投资于数据管理的加强、决策自动化以及像自然语言处理(NLP)这样的分析能力。Gartner预测,到2025年,CDAO将把数据编织视为成功应对数据管理复杂性的主导因素,把重点放在增值的数字业务优先事项上。
趋势3:取得信任
随着生成式AI可及性和效率的日益提高,如何应对这个数据可靠性不断受到质疑的世界已变成一大难题。企业内部信任缺乏、对数据价值和质量的担忧以及围绕AI的法规正在导致不信任泛滥。
方琦表示:“不可信的数据可能无法用来作出决策”。
“D&A领导者应使用决策智能实践来建立对数据的信任并监视决策过程和结果。此外,为了取得利益相关方的信任,落实有效的AI管理和负责任的AI实践至关重要,例如建立数据的AI就绪性,也就是说数据要符合道德规范、安全、无偏见并且丰富到能够做出更加准确的回答。”
趋势4:被赋能的员工
方琦表示:“将AI应用于D&A必须能够赋能员工,而不是让他们感到受到威胁或沮丧,这一点十分重要。”
企业机构必须投资于培养员工的AI素养、使用具有适应能力的治理实践实现有效的治理并落实基于信任的信息资产管理办法,帮助个人知晓他们所使用的信息的出处。
方琦表示:“AI培训的重点不止是人数,还需要采取不同的方法。企业机构要认识到专家级AI用户所需具备的技能将与其他用户截然不同。Gartner预测到2027年,由于企业未能从生成式AI中获得预期的价值,半数以上的CDAO将获得数据素养和AI素养项目的资金。”
好文章,需要你的鼓励
亚马逊云服务宣布雷尼尔项目正式投入运营,该AI超级集群配备近50万块Trainium2芯片,分布在多个数据中心。AWS称这是全球最大的AI计算集群之一,从宣布到全面运营仅用不到一年时间。合作伙伴Anthropic计划年底前扩展到超过100万块芯片。该项目与OpenAI星门计划展开激烈竞争,AWS凭借自主硬件开发优势能够控制从芯片到数据中心的完整技术栈。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
谷歌开始推出Fitbit应用的重大更新,采用全新设计并集成由Gemini AI驱动的个人教练功能。该更新于10月28日首先面向美国地区的Fitbit Premium用户开放,后续将逐步扩大覆盖范围。新版本围绕今日、健身、睡眠和健康四个主要标签重新设计,强调周趋势数据分析。AI教练功能可根据用户的实时和历史数据提供个性化建议和训练计划,支持语音或文字交互。用户可选择是否使用AI功能,预览期间可在新旧界面间切换。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。