随着CIO角色复杂性的不断增加,人们开始更多强调其对于业务和技术两大赛道的深入理解和熟练把控。只有这样,新时代的CIO们才能真正思考并正确规划下一步行动。以Manfred Boudreaux-Dehmer为例,作为北约首任CIO,他对于为32个成员国以协商一致方式做出决策有着独特的视角。而且在全球技术发展的大背景之下,他还必须为整个组织设计出一套稳妥的指导原则。
“首先需要定义一个能够根据各层面判断实现信息自给自足的组织,之后才能设定愿景并加以执行。但要想达成这个目标,一味施压反而是背道而驰。CIO的意义在于提供成功的催化剂、执行的好帮手,让每个人都能在自己的工作面上发挥出最佳水平。”
具体来讲,他积极推动北约的数字化转型,包括构建业务解决方案并建立起跨多领域运营的凝聚力,并始终在强调培养多方顺畅沟通技能对于达成长期IT目标的重要意义。
“大家必须使用正确的语言进行沟通——也就是业务语言。我很早就意识到,终有一天我会走到特定的岗位,需要替CFO办事并向其汇总事实、数字、数据和内部回报率,而且必须使用对方听得懂的语言。但在首席营销官CMO那边,他们对于语言表达又有自己的理解——我们要如何改变世界、影响生活?这就是各方在理解语言表达时的固有差异。而数字化转型的起点永远是人,永远是这些截然不同的思维方式。”
在北约这样一家大型公共机构,Boudreaux-Dehmer和他的同事们为创新设定了三大支柱——公共部门、产业界和学术界。三者结合起来,才能为北约提供重要的支撑和助力。但他同时表示,目前大部分繁重工作其实都是产业界在承担。
“有些人关注创新和有趣的技术应用,但我们却更重视网络安全、数据隐私和数据机密性。相信每个人都能感受到我们对于数据保护和保密工作的重视。而从结果倒推,才能确定我们需要怎样的流程、企业应当实现怎样的目标,还有如何塑造人们的技能、知识和经验来支持卓越流程。再往后,就是思考分别在云、数据分析、数据开发和AI方面做出哪些技术选择。总而言之,最基本的思路在于如何改变业务,其余的都要沿着这条主干推进。”
CIO Leadership Live主持人Rennick最近与Boudreaux-Dehmer讨论了跨部门合作、在董事会中建立话语权,以及在庞大的全球互联聪明中制定CIO标准等议题。以下内容经过编辑以保证精简顺畅。
关于把握机会:我在康柏南美分部工作时,需要用西班牙语交流,所以我就特意学习了这门语言。在此之后,我又经历了一系列必须努力争取才能得到的机会。比如我是在LinkedIn上找到北约发布的招聘信息,当时我以为自己肯定通不过测试。毕竟我没有任何公共部门或者军事机构从业经验,我这辈子都泡在私营行业当中。所以最终受邀参加选拔时,我真的非常震惊。我本以为自己只是象征性的作为外部候选人参加,但还是决定要竭尽全力做好准备、在测试和面试中取得好成绩。后来,还真的就被选中了。所以如果大家觉得自己已经能够达到要求,那就认真去做,哪怕身上看似还有不尽人意的地方。只要努力追求卓越并谨慎论证,想清楚自己要成为什么样的领导者,就没有过不去的坎。唯一的重点,就是明确我们能接受什么、不能接受什么。
成为首任北约CIO的感受:人们总会问我,为什么北约之前不设CIO这个职务。答案就是北约一直是个高度分散的组织,已经拥有近75年的历史,而其中的IT部门期间一直在自由发展。直到两年之前,北约才决定任命一位CIO来协调内部的IT体系。这份工作涉及协调部门架构、技术选型、产品组合管理、服务水平协议等等。在等待安全检查结果时,我接到了招聘负责人打来的电话,告知我接下来的工作范围将扩大到北约内部各部门的网络安全。所以我现在不只管理信息和技术,也需要承担网络安全、风险管理和重大事件应对等方面的工作。
关于领导力:最开始当团队主管的时候,情况跟北约这边完全不同,当时我管理的只是个五人小组。人越少,工作就越简单,毕竟我能随时掌控全局。另外,最早的工作环境层次分明、高度受控,我会在自己的办公桌上完成一项任务,再把成果调整成其他人容易理解的形式。但北约这边肯定不行。所以作为领导者,我认为大家必须让团队的定义跟商业愿景匹配起来。是的,别总聊什么IT愿景,IT的意义就是为业务服务,所以永远要把业务愿景排在首位。这就是基本指导原则,我们要反复强调并在组织内对齐,无论发生什么都要把大家牢牢团结在这个中心周围。
自我发展:所谓管理工作,不只是要告诉人们该做什么。在我看来,董事会就像是车厢,而我自己则是拉车的马。永远是马在前、车在后,不可能车在前、马在后。所以我们得证明自己的作用,比如分享一些有价值的观点、见解、技术同事们感兴趣的话题等。通过这种潜移默化的方式,我们就能把自己的知识、想法和热情传递给他们,逐步赢得各个部门负责人、CFO、CMO、COO乃至CEO的关注乃至尊重。不知不觉当中,CEO就会打通我们跟董事会、或者说车厢间的联系。时至今日,很多CIO还是在讨论如何塑造人设,我觉得时代已经变了。随着新冠疫情的突然爆发,CIO迅速成为整体业务的综合性领导者,这种定位上的变化也成为数字化转型工作的前提和组成部分。所以我们真的得以不同的眼光审视这个问题了。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。