Robert Michael(外号Data Bob)是零售商DFS的数据团队负责人。他是该公司的第一位数据负责人,负责把信息转化为洞察力,这意味着他已经成为这个家具企业中备受尊敬的人物。
“这个昵称不是我给自己取的;我加入公司的时候就有了,而且就在整个组织内推广数据管理的想法和概念的时候,这变成了一个巨大的好处,帮助我打破一些障碍。”
Michael在2020年2月加入DFS Group,该集团旗下还包括了Sofology品牌。当时集团一直在考虑任命一名数据负责人,并建议Michael签订一份为期12个月的合同,让双方都能够审视这个角色的适合度。加入集团之后,他发现的是信息——而且是大量的信息。
“我们并没有因为缺乏数据而苦恼,事实上,当时我们可能对数据做了过度的处理——我们确实在分析过程中面临瘫痪而痛苦挣扎。有时,你只需要简单的数据即可做出正确、快速的决策。”
Michael深入研究了公司的数据系统,并提出了一些有关策略的建议。上任6个月之后,他和他的老板认识到合作关系正在发挥作用,于是他被任命为数据团队的长期负责人。
“这很合适,我围绕自己想对团队做什么提出了建议。我想让人们有信心,使用我们的数据来支持他们在日常工作中想做的事情。”
让组织变得舒适
Michael向首席运营官汇报。从一开始,他就明确表示自己不想成为IT组织的一部分。虽然他与CIO有密切合作,CIO也向COO报告,但数据和技术部门是作为独立实体运行的。
他说:“我从财务和IT部门抽调人员组建了一支数据团队,我希望把整个行业的不同技术人员聚集在一个团队中。有些人离开了,这没什么,因为我可以塑造我想要的组织的样子。”
Michael招募了外部人才。他还从组织内其他角色中挑选了那些被视为“数据冠军”的人:“我们可以为人们提供技术技能,但他们也有业务理解能力,这至关重要——能够从数据的角度阐明企业的需求。”
为了证明他们对组织的价值,Michael和他的数据团队寻求取得一些“快速的胜利”。他们首先关注财务和每周交易报告,这些是报告用Excel制作的。这种旧的工作方式意味着有人必须在周一早上五点钟到公司并为午餐时间的交易会议制作报告。
“他们必须花七个小时来写报告,而我不想早上五点起床做这项工作。但如果我不准备这样做,我也不指望其他人会这样做。因此,我们利用Power BI把所有不同的数据集整合在一起,开始每天生成交易报告。”
Michael表示,对组织的影响是立竿见影的:“这个项目证明了数据集成方法带来的价值。这一举措给我带来了赞誉,也让我有机会更广泛地审视数据战略。”
迁移到云端
如今,Michael管理着一支24人的数据团队,其中包括12名内部员工和12名海外员工。他在DFS工作三年期间,取得的主要成就之一是将两个内部数据仓库(一个用于金融,另一个用于商业信息)重新平台到Google Cloud Platform (GCP)上。
财务数据仓库已经完成平台化改造,商业系统将于年底上云。他说:“这意味着我们将从统一化中受益。”
“我们将拥有一个位于组织核心的公共信息中心。除了使用GCP之外,我还决定采用无服务器。我想雇用数据人员来处理数据,而不是维护基础设施。”
Michael表示,与以前的数据管理方式相比,使用云和无服务器还为公司节省了资金。当他开始在DFS工作的时候,他发现人们一直在运行那些不再需要的应用和报告。
他说:“我们能够改掉这个习惯,我们查看了报告,查看了数据,实际上我们已经证明,新系统中的数据要比旧系统中的数据更准确,所以这也是一个巨大的好处。”
关闭旧系统绝非易事,新的工作方式可能会导致来自那些受变革影响的人们的抵制。尽管Michael承认他也会有一些担忧,但他的团队有效地管理了变革,并且把数字化转型的文化影响降至了最低。
他说:“当我们结束旧的报告方式时,的确产生了一些‘噪音’,不是很大的噪音,因为我们已经进行了大量的沟通。我们预先做了沟通工作,实际上我们可以相对较快地做出改变。”
提供个性化
统一化之后,Michael就制定了宏伟的DFS企业数据计划。他的长期目标是创建一个数字孪生,让企业不同部门的人员能够了解到如何实现潜在的运营变革。
他说:“如果我们以正确的方式将所有内容组合在一起,我们就有机会开始通过各种数据点对组织中发生的所有事情进行建模,我们实际上可以反映出业务中正在发生的各种情况。”
“我们可以帮助制定未来的业务战略,因为我们可以在实际开始工作之前对潜在的结果进行建模。但这是一个巨大的改变,是为了找到我们可以继续特定旅程的正确方向。”
Michael再次认识到文化变革将发挥关键作用。让人们达成共识,这是漫长创新之旅的第一步,最终结果是实现了数字孪生技术的发展。
“这个项目是为了建立数据信任,这意味着我需要以一致的方式将其整合在一起。因此,如果我们有一个客户需求规划系统,我们向客户发送消息并报告他们的需求,那么我想使用一致的数据集。我不想看到矛盾和争论。”
Michael表示,所有这些以数据为主导的转型工作,最终目的是为客户提供更高的透明度和更好的体验。虽然有些客户只想等着他们的“沙发”放好之后收到DFS的通知就行了,但有些客户则需要每周更新一次信息。Michael的团队需要为所有类型的客户需求提供个性化的洞察。
“就成本而言,‘沙发’是一件高价物品。如果你必须等待八周才能制造出沙发的话,那么作为一家公司,我们需要确保我们的客户在需要更新时也能得到更新。每次他们打来电话的时候,我们都必须有人在电话那头准备好向他们提供他们想听到的最新消息。”
成功在于以一致的方式建立关系并为客户提供洞察:“我们希望能够监控从销售流程到交付流程的所有环节,以便我们能够为他们提供可见性。”
引领数据管理
Michael回顾了他的职业生涯,其中包括在金融专业Lowell和设施管理公司Carillion的工作经历,他表示,他本质上是一名分析师。
“我喜欢了解正在发生的事情,如果我了解了这些事情,我们就可以帮助企业做出更好的决策。”
他表示,到目前为止他的职业生涯远未达到计划,他从未打算成为数据负责人,但是现在他就是Data Bob,他当然很高兴有机会去攻克他发现的挑战。
“我喜欢数据,正如我对人们所说的,我在DFS工作了三年,没有任何一天是在无聊中度过的。我不一定每天都过得很开心,但绝对不会感到无聊。”
Michael此前参加了咨询公司Carruthers and Jackson组织的圆桌会议,谈到了该公司最近发布的数据成熟度指数结果。调查显示,有近三分之一的组织(31%)要么数据角色和责任不明确,要么根本没有正式的数据角色和责任。
Michael在职业生涯中承担的广泛职责让他认识到,首席数据官(CDO)是企业中的一个关键角色,不仅每个组织都需要一位数据负责人,而且信息领导力对企业的重要性只有一个方向——向上的。
“整个生态系统都需要围绕数据进行处理,从提供数据盒子一直到处理安全问题,但我们必须在整个组织内开始宣传数据的重要性。CDO这个角色还处于萌芽状态,并且正在不断发展中,我们需要了解这个角色将如何适应组织的未来发展。”
好文章,需要你的鼓励
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。
这项研究提出了"思想家"(Thinker)任务,一种受人类双重加工理论启发的新型AI训练方法。研究者将问答过程分解为四个阶段:快速思考(严格预算下给出初步答案)、验证(评估初步答案)、慢速思考(深入分析修正错误)和总结(提炼关键步骤)。实验表明,该方法使Qwen2.5-1.5B模型的准确率从24.9%提升至27.9%,DeepSeek-R1-Qwen-1.5B模型从45.9%提升至49.8%。显著的是,仅使用快速思考模式就能达到26.8%的准确率,且消耗更少计算资源,证明了直觉与深度推理作为互补系统的培养价值。
这项由ELLIS研究所和马克斯·普朗克智能系统研究所的科学家进行的研究,揭示了大语言模型安全测试的根本规律:越狱攻击成功率由攻击者与目标模型间的能力差距决定。通过评估500多个攻击者-目标组合,研究团队发现:更强的模型是更好的攻击者;当目标能力超过攻击者时攻击成功率急剧下降;社会科学能力比STEM知识更能预测攻击成功。基于这些发现,研究者建立了预测模型,表明随着AI进步,人类红队测试可能逐渐失效,提示需要发展自动化安全评估方法及更全面地评估模型的说服和操纵能力。
华中科技大学和香港中文大学研究团队提出SATORI-R1,一种通过空间定位和可验证奖励增强多模态推理的新方法。该方法将视觉问答任务分解为图像描述、区域定位和答案预测三个可验证阶段,解决了自由形式推理中注意力分散和训练收敛慢的问题。实验证明,SATORI-R1在七个视觉问答基准上一致提升性能,最高达15.7%,并展示出更聚焦的视觉注意力和更低的训练方差。