几年前,当澳大利亚红十字会(Australian Red Cross)这个社区服务慈善机构开始进行数字化转型的时候,发现有很多不同的系统无法协同工作。如今,经过数据梳理和发挥作用,可以满足不断变化的需求。
在澳大利亚红十字会数字化转型之旅开始的时候,首席信息官Brett Wilson很快就意识到他们的数据存在问题。他说:“我们整个组织有大约250个应用,这些应用都产生了大量的数据。”但这些信息对他们没有任何帮助,其中大部分数据都是孤立的或者无效分割的,导致一些业务决策和投资都是基于不完整的或者被误读的数据。
澳大利亚红十字会首席信息官Brett Wilson
“如果你对数据没有很好的理解,就无法很好地利用它,”他说。因此,他们开始着手构建一个能够聚合、清理和组织数据的客户数据平台(CDP)。这个平台把捐赠者的交易历史与来自网站、电子邮件、社交和其他来源的行为数据相结合,创建能够推动筹款活动的营销自动化活动,与每位捐赠者进行更个人化的互动。
正确使用数据
有句话说,数据是新型石油,但石油只能使用一次,Wilson说:“我更愿意把数据视为一种可重复使用的可再生资源,可以与其他数据源链接以发现新的洞察。我们数字化转型工作的目标是打造一个数字主干,以便整个企业的很多不同系统都可以协同工作并相互增强。”
大约15年前,企业只是存储数据,并没有真正考虑他们可以用这些数据来做什么。“今天,我们首先要问的问题是,我们是否必须保留这些数据,我们可以用这些数据来做什么,以及我们如何将这些数据转化为商业资产。”为了得到答案,他们寻求外部合作伙伴的帮助。“对我们来说,重要的是我们有合作伙伴,他们知道什么是好的——不仅是在你推出一个系统时,而且从数据的角度,因为我们从许多不同的电子表格和系统中提取数据,需要有人能说你不想引入这些数据,因为它不会在以后增加任何价值。”
税务透明度
在每个财政年度结束时,澳大利亚红十字会都会开展税收活动,提醒人们他们的捐款是可以退税的。“有了正确的技术和更清晰的数据,我们在税收活动后看到捐款增加了10%,我们不能把这一切都归功于数据,但数据绝对是让我们比过去更有效地推广的基础。”
结果不言而喻。过去,澳大利亚红十字会运行着很多不同的Excel电子表格和系统。但现在,每个人(多达20000人)都可以在一个系统上展开工作。此外,他们还开发了全面的数据治理功能,详细说明了澳大利亚红十字会将如何使用数据以及不会使用哪些数据。“换句话说,这涵盖了从我们如何收集信息、与谁共享信息、再到我们必须保留多长时间才能将其删除等所有内容。”这一切都归结于了解哪些数据更具战略性并实现具体结果,这一切都需要进行企业文化上的重大转变。
做出改变
回顾这一过程,Wilson说,变革管理是项目的症结所在,他们本可以做得更好。具体来说,他认为他和他的团队应该花更多时间了解他们所做变革带来的影响,特别是对现场运营和内部运营团队的影响。
“重要的是让每个人都参与进来,这样他们就会明白事情为什么会发生变化,以及他们会得到什么好处,而不是仅仅告诉他们我们正在推出一个新系统,不管他们喜不喜欢,他们都必须使用这个系统,”他说。
他还强调了让员工有主人翁意识的重要性。“毕竟这是他们的平台,我们只是恰好支持部署并维持这个平台,但他们需要适应它,因为他们要使用它。”
最重要的是,不要低估组织变革。“既然我们已经打下了基础,或者说数字支柱已经到位,我们必须专注于改进,但除非我们带着大家一起踏上征程,否则我们就无法做到这一点。这不仅仅是关于技术实施,还需要能够讲述故事,这样每个人都能理解你在做什么以及为什么要这样做。”
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。