英国就业及退休保障部被誉为欧洲最大的IT资产之一,管理着5000万行代码,这些代码具有巨大的复杂性和规模。
Corbridge表示,他很高兴能够帮助实现该部门的愿景,即提供优质服务造福社会。
他说:“人们对就业及退休保障部的数字化期望很高,这是对的。我认为我的角色是一个促进者,通过扫清道路和消除障碍来推动我们实现目标的进展。”
“我想把各种事情结合起来,确保我的同事拥有完成工作所需的一切,并帮助他们了解如何将他们在日常生活中遇到的数字体验,反映在他们提供的服务中。”
快速灵活的商业计划
Corbridge在今年4月接替前CDIO Simon McKinnon,他在安顿下来的这段时间“尝试找出提升的路径”,与此同时他已经在DWP Digital制定、敲定以及发布了未来12个月的业务计划。
事实上,整个过程从开始到结束只花了几周的时间。Corbridge来到公司后自言自语地说:“我们怎样才能在40天内写好、准备好、并获得批准一份商业计划呢?”
他说:“我们做到了,这是通过将业务计划转变为‘人类文档’来实现的,我把对技术的内部关注转变为对DWP Digital提供帮助的关注。”
“我认为我们在业务计划中所做的改变是为了让我们感觉更像是为DWP、我们的同事服务,而不是专注于技术部分。”
该计划还包括DWP Digital员工的照片以及他们所做工作的描述,试图“让数字化变得人性化”。
虽然政府可能并不总是以将商业计划迅速付诸行动而闻名,但Corbridge指出,这不仅仅是一个“公共部门”的事情——由于现有的治理量,这种情况发生在大多数大型组织中。
他说:“我们要做的是找出如何降低风险,或者我们做某事的风险偏好是怎样的,如果这不奏效的话,那么很庆幸我们已经知道了它不奏效,这样我们也会从中吸取教训。”
他补充说,重要的是要将商业计划摆在人们面前,不断完善它,而不是采取“它根本无法改变”的立场。
“只要你说这个计划是一个不断发展的计划,而且现在人们对这个迭代感到满意,我们也是可以来回进行调整的,那么我们就没有理由花六个月的时间来编写、准备、测试和发布,因为它是一个动态的文档。”
“我希望通过我们想做的一些创新进入类似的领域。我们如何测试和学习,如何学到一些东西,即使我们不得不将其关闭,但其方式和我们已经推出了一些东西并且取得成效是一样的?”
“我们可以而且应该觉得,如果我们能为80%的同事或者80%的客户提供服务,而我们必须为另外20%的人做一些不同的事情,那也没关系。我们不需要找到100%适合现有所有案例的东西。”
测试人工智能的想法
DWP本身在过去几年中就已经经历了巨大的变化。该部门曾经是英国政府最大的外包商之一,现在已经将其产品和服务的所有权收回到内部,其中就包括了寻找新的创新技术,并看看是否有适合该部门的技术。
DWP Digital最近实施了一种称为“灯塔流程”的方法,用于评估人工智能(AI)的不同机会及其是否可行。
Corbridge说:“AI是否符合DWP严格遵循的标准,即人类必须就福利支付或个人支持做出任何决定?我们如何部署AI?我们可以把AI部署在哪里?”
“通过创建这个框架,我们现在可以提出一个想法,对其进行评估,确保它在道德方面是合理的,确保同事不会因为我们所做的事情而感到威胁,并且确实提高了我们所做业务的效率。”
他补充说,该计划从现在到2024年4月,将有5到8种不同的方式来应用不同类型的AI,并测试和了解有怎样不同的结果。
“他们必须应对道德挑战,并且必须能够解释这一事实,这一事实始终是我们非常关心的,如果我们不能向我们的企业解释它的运作方式,我们就不能这样做,因为那太可怕了。”
遗留挑战
2022年5月,时任CDIO的Simon McKinnon启动了该部门为期三年的数字未来战略,旨在重新构想数字服务,使其更加个性化、准确和高效。
该战略的五个支柱包括通过为同事和客户实现DWP Digital所描述的“24/7全天候交付高性能、可持续、可访问的数字服务”来提供可靠、安全、经济高效的服务。
与大多数大型组织一样,尽管DWP近年来取得了巨大的进步,但仍然拥有庞大的遗留资产。Corbridge表示,需要更好地管理这些遗产,以“建立更快、更便宜、更高效的数字服务”。
然而,替换旧版本并不总是那么容易,不仅在DWP,在任何地方都是如此。
他说:“用新东西取代旧东西很难获得投资回报。”他补充说,需要有一种方法来评估不这么做的风险,并将其纳入商业案例中。
“整个政府确实有兴趣弄清楚是否有一种方法可以为所有政府做到这一点,以便我们开始了解运行IT的成本,而不是利用IT进行转化的投资回报。”
现代化数据管理
数据与所有这一切密切相关。作为一个部门,DWP有很多数据。
Corbridge表示,数据现代化在很多方面与遗留挑战相似,因为该部门需要采取的是一种整体的方法。
他说,如果没有现代数据层,“我们就无法用人工智能来做每个人都在谈论的、很酷的事情”。为了应对这一挑战,该部门正在完成他们的数据现代化战略。
他说:“这让我们不仅仅修复数据存储的位置,并将其放入云中,”而且还允许该部门使用云原生服务“帮助我们从数据中获得更多信息,了解我们如何在整个数据中特别使用身份,以便我们可以追踪和跟踪单点联系”。
“我们希望达到一种状态,那么就是客户告诉我们一次,就会影响到我们在整个系统中所做的一切变化。”
Corbridge拥有医疗行业的背景,在加入Boots公司之前,他曾担任家乡利兹教学医院NHS Trust的CDIO,以及爱尔兰卫生服务执行机构的CIO,他把医疗行业与打造更加个性化服务的使命、以及如何将其应用于DWP进行了比较。
“如果我们能够知道某人失业或者需要福利,从而主动与他们联系并说:‘我们知道这些是您过去拥有的技能,这些是您本地的工作,让我们帮助您申请这些工作’,会怎么样?”他说。
“我们利用数据和围绕个性化存在的工具,明确地为劳动力市场提供大规模个性化和人们所需的福利,并在这一过程中尽可能减少摩擦。”
他说,随着我们进入新冠疫情后时代,生活成本上升,客户支持的范围在扩大,种类也在不断增加。
“劳动力市场改变了人们对工作的期望,人们愿意从事的工作类型也发生了变化,我们也需要注意到这一点,”他说。
数字身份
如果没有数字身份或者通用标识符,创建这些个性化服务是非常困难的。目前,DWP有不同的地方供客户登录以获取不同的服务。
Corbridge说:“我们有一个完整的职能部门负责研究需要在DWP提供的所有内容中创建共享服务”,其中包括研究如何创建跨所有DWP系统的单一登录功能。
如果客户登录一项福利并报告情况变化,Corbridge希望将其反馈到其他福利或系统中。
DWP现在还向宽带提供商提供了API,以便他们能够找出谁享受某些类型的福利,并能够提供折扣或者入户预定宽带服务。
Corbridge说:“希望其他提供商也能使用相同的API,而且是可以重复使用的。关键是要考虑我们可以构建多少这样的东西,以便我们可以把关键概念反复利用作为一种战略参考。”
Government Digital Service (GDS)目前正在创建一个名为One Login的数字身份系统,不同部门的多项服务正在试用该系统。虽然各部门要强制使用该系统,但其他数字身份系统仍然可以并行运行。
Corbridge表示,DWP在跨政府的“One Login”方面处于领先地位。他说:“我们将在9月做一些早期阶段的工作,并计划在2024年将其真正融入到我们可能做的一切事情中。”
招聘及技能
和大多数有大量工作要做的大型组织一样,DWP正在寻找合适的技能来完成这些工作。不过Corbridge表示,在公共部门招聘合适的人才可能比在私营部门更容易,因为政府的工作机会往往会吸引“那些肩负行善使命的人”。
他说:“我们将吸引那些希望其职业以专业化和成长为基础的人,而不仅仅看重月底工资的人。”
他补充道,DWP并不具有你在其他一些组织中看到的“高人一等的残酷本质,这在很大程度上反映了我们是如何互相支持的,因为最终目标是我们客户的利益,我们要让同事尽可能轻松地提供这些服务”。
DWP还与BCS合作创建一个涵盖了不同数字技能的专业化计划,以便他们能够得到认证和认可。
他还指出,希望继续推动构建一种赋予部门人员权力并庆祝多样性的文化。
他表示:“当我接受DWP性别倡导者的角色时,我们将在整个组织内始终如一地致力于多元化和包容性。”
DWP将与政府其他部门一起在2023/24年期间通过《辅助和无障碍技术残疾人行动计划》。
好文章,需要你的鼓励
ETH Zürich等机构研究人员提出TrustVLM框架,解决视觉-语言模型预测可信度问题。该方法利用模型中存在的"模态差距",创新性地结合图像到文本和图像到图像的相似度,实现无需重新训练即可大幅提升误分类检测性能。在17个数据集的严格测试中,TrustVLM相比现有方法在关键指标上提升显著,同时改善了零样本分类准确率。此成果为AI系统在自动驾驶、医疗等安全关键领域的可靠部署提供了重要保障。
这项研究提出了个性化安全概念,解决大语言模型对不同用户采用统一安全标准的问题。研究团队创建了PENGUIN基准测试集评估模型在处理高风险场景时的个性化安全能力,并开发了RAISE框架高效获取关键用户信息。实验表明,提供用户背景可使安全分数提高43.2%,而RAISE框架通过平均仅2.7次交互即可提高安全分数31.6%。这一创新方法将AI安全从"一刀切"转向"个性定制",为高风险领域的AI应用提供了新思路。
明尼苏达大学研究团队提出了一种创新方法,通过回合级信誉分配显著提升大语言模型(LLM)智能体的多回合推理能力。传统方法只对整个过程进行评价,而他们的MT-GRPO算法能够精确评估每个决策步骤的价值,就像为每一步提供具体反馈。在维基百科搜索工具使用场景中,该方法实现了100%的工具执行成功率和50%的答案精确匹配率,远超传统方法。这一突破不仅提高了AI在多步骤任务中的表现,也为开发更复杂的AI系统提供了重要思路。
这篇研究介绍了PISCES——一种能精确从大语言模型参数中移除特定概念知识的创新技术。与现有方法不同,PISCES通过解缠器模型识别概念相关特征,直接编辑模型参数,实现了更精准的知识移除。在Gemma和Llama模型上的测试表明,该方法不仅有效降低了目标概念的准确率(低至7.7%),还保持了模型在无关领域的高性能,并显著提高了对"重新学习"的抵抗力。这一突破为AI系统的安全部署和合规使用提供了新的可能性。