新成立的国家数据局旨在统筹规划,利用数据实现高质量增长和技术创新。然而,对于大多数中国企业而言,数据被局限在IT中使用,未能充分发挥业务方的作用。2023年Gartner 首席信息官(CIO)和技术高管调研显示,中国CIO最常见的业务重点之一就是是“数字化转型和有效利用数据”。
然而,大多数中国企业的数据相关任务仍然是完全由IT部门驱动。从Gartner问询数据来看,与全球客户相比,中国企业更关注于数据和分析(D&A)落地,而非D&A战略。Gartner高级研究总监方琦表示:“中国的CIO在促进IT内部数据团队与业务团队协作、实现数字经济的最佳业务成果方面面临着重大挑战,包括量化数据平台的投资回报率、利用数据改善决策,以及高效地交付D&A价值。“
为了将挑战转化为机遇,在数字中国的浪潮下,中国的CIO应优先考虑数据议程,从三个战略方向与业务利益相关者进行战略性沟通,以更好地拥抱数字经济。
图1:IT部门D&A领导者支持数字经济的三个战略方向
确保必要的产品管理和执行能力,打造数据产品
根据Gartner最新的首席数据和分析官(CDAO)调研,超过60%的全球D&A领导者负责领导或全面参与D&A产品开发,而Gartner从客户互动中了解到,中国的D&A领导者很少参与产品开发。
根据中国财政部对于企业数据资源处理的征求意见,供内部使用的数据服务、信息产品、洞察交付和模型等数据产品,可作为无形资产处理。对外销售的数据产品可作为存货处理。这使得企业能够灵活处理数据加工处理成本,并更好地反映数据资产的价值。
高级研究总监方琦表示:“并非每个企业都有能力打造转化型数据产品。企业应抓住最佳数据变现机会,充分利用其数据独特性、业务背景和数据消费者的优势。企业要大规模利用数据产品的价值,其产品必须经过深思熟虑的设计,同时具备必要的产品管理和执行能力。”
利用价值流改善数据驱动型决策,打通孤立的流程
日益复杂的业务场景和瞬息万变的业务环境,给企业带来了前所未有的挑战,如需求难以预测、难以协调不同业务职能部门的工作、用户需求不断增加、市场环境不确定性增加等。在这种情况下,许多企业决心改善决策流程,提高效率和敏捷性,并培养数据驱动型文化。为了打通孤立的业务流程,CIO应使用价值流来串联业务流程,包括关键决策点;借助Gartner决策智能模型来映射关键决策网络。
图2:价值流和决策网络映射
培养数据素养,打破企业边界,加速数据共享,实现更好的业务成果
过去几年中,数据和分析一直是中国CIO投资最多的领域。越来越多的中国企业开始建立大数据和AI实验室,以获得独特的优势。随着数据共享成为数字经济的重要组成部分,越来越多的企业开始打破企业边界,与其他企业共享数据,使AI算法更加强大。
高级研究总监方琦表示:“中国的CIO需要培养数据驱动型思维,以推动业务价值的实现。为此,CIO需要让团队成员在多个业务和技术利益相关者之间担任‘译员’。这些‘译员’应明确可借助数据和分析来改善的决策要求和业务场景。”
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。