JLR 首席数字和信息官 Anthony Battle 非常倚重 AI 和 IA(人工智能和智能自动化),以达到实现捷豹路虎的数字化转型的目的。
Battle 于 2022 年 2 月加入捷豹路虎,出任集团首席数字和信息官,此前他曾在多家石油公司长期从事 IT 管理工作。捷豹路虎也在摆脱对石油的依赖,不久前捷豹路虎宣布计划到2025年实现捷豹系列全电动化并在本世纪末为所有其他车型提供电动版本。
JLR向电动动力系统转型是公司称之为“重塑”计划的一部分。根据该计划,JLR 还计划到 2030 年将旗下供应链和运营产生的温室气体排放量减少到 2019 年温室气体排放量的一半,并在 2039 年实现碳净零排放。
Battle 表示,“我们的业务转型是 100% 地以数字化转型为基础。Battle称,”我们的业务转型100%是以数字转型为基础。这既适用于汽车电气化的工程团队,也适用于Battle负责的那些正在改造公司IT系统的团队。
为未来车辆提供最佳用户体验需要新的数字服务以及与现有服务的新整合。他表示,“这意味着我们需要从车辆提取大量的数据并向将其输送给车辆。因此,在产品工程和企业 IT 的交叉点上需要在云、软件工程标准、集成和 API 方面实现高度协同。”
人工智能和智能自动化
Battle 说,JLR在过去的五年中发现,JLR需要转向数字中心化,或者换句话说,采用数据优先的方法,将结构化或非结构化数据进行定位,使得公司可以采用人工智能和智能自动化工具的方式来帮助JLR作出明智的决策。
有很多软件供应商愿意帮助解决这个问题,也许太多了。
Battle 带点讽刺的口吻说,“我们并不缺战略供应商和厂商为我们慷慨地提供各种机会。一说起任何涉及人工智能或自动化的产品,每个人都想在这个旅程上帮助我们。”
需求也是存在的。他补充表示,“我们的业务绝对渴求这样的需求。但我们会谨慎行事。”
Battle 在评估生成式人工智能潜力方面得到了一些外部支持,原因是 JLR 是Tata集团的一部分,而Tata集团还拥有 Tata 咨询服务公司。他表示,“Tata 咨询服务公司和许多其他 Tata 组织已经在许多此类领域发展到开始探索新想法了。”他称会在这一块找机会合作。
他表示,生成式人工智能已经进入JLR,一些软件开发团队在编码模式和方法论等不同部分使用生成式人工智能。他表示,不过现在,“我们正在考虑如何设置防护栏、指令和控制。对我们来说,这是一个大项目,不仅要确定我们的数据和人工智能战略,还要确定自动化战略。”
Battle 已经在其中一些领域将支出集中在少数几家供应商身上,例如,在数据方面倾向于使用谷歌云平台,而在流程自动化方面则倾向于使用 Appian。
他表示,“我们已经投入了大量的 RPA 能力,但我认为 Appian 可能是我们目前最大的引擎。”
需要变革
JLR 与 Appian 合作的首批项目之一始于 2020 年英国脱欧协议生效后的几个月。
Battle 表示,“由于英国脱欧,我们不得不加倍努力寻找智能解决方案,最好是智能自动化解决方案,以应对英国脱欧所带来的所有繁文缛节和立法。”
JLR 突然发现自己在英国的制造工厂与欧盟的主要供应商被被一堆新的海关法规和文件隔开了,JLR 曾认真考虑过雇佣一些员工来处理这些文书工作。但 IT 团队提出了一个数字化解决方案。
为了确定需求范围,公司组建了一个由税务、立法、材料规划、物流、售后市场销售和财务领域的专家组成的跨职能团队,团队也得到 Tata 咨询服务公司的一些外部支持。
JLR 在 Appian 上建立的文件处理系统每天约有 150 个用户,处理约 250 份报关单。他表示,该系统使员工得以腾出时间做其他事情,并令公司节省了 1,500 万英镑(约合 1,900 万美元),这主要得益于从自动化流程中提取的数据减少了关税支付。
虽然这个项目取得了成功,但 Battle 希望能够使用不同的方法。
他表示,“我们当时必须尽快找到解决方案,这种速度并不适合流程改进。”快速行动意味着企业必须进行调整去适应变化。
他表示,“我们已经学到,前期花在绘制流程图和进行流程工程设计的时间是一项非常有价值的投资。”
那些觉得自己的待办事项清单太长而且每天都在增加的员工,一定会欢迎那些承诺可以释放时间的新工具。不过,那些工作量较轻的员工可能会对似乎多余的东西持怀疑态度。
但 Battle 表示,“没有什么比推广宣传的力量更强大。同事在工作流程接触新技术,然后推广给其他同事,其他同事再成为新技术的拥护者或传播者,这就使得问题的框架得到重新定义。这样一来就不再是我在询问或指导,而是企业、我们的服务对象在倡导变革的必要性。”
技能发展
虽然自动化帮助 JLR 避免了雇佣大量数据录入员,但像其他正在进行重大技术转型的企业一样,JLR 也还是不得不雇佣或培训员工,以满足对新技能的需求。
2022年11月,JLR 以填补 800 个人工智能和机器学习、云软件、数据科学和其他领域专家的职位空缺为目标招募了其时被全球科技公司解雇的工人。
2023年即将结束,一些大型科技公司的工程师面临着新一轮裁员潮,JLR的招聘策略或许值得其他雇主效仿。
Battle 表示,“此次招募是一次巨大的成功。我们吸引了不同层次的一些令人难以置信的数字人才。”
制造公司可以为其软件开发人员和其他IT工作者提供一些谷歌或Meta等公司无法提供的东西,他们可以看到自己的工作成果或他们支持的工作成果从生产线上迈向门外的现实世界。你可以切身感受到你所做的工作与我们创造的产品之间的关系,因此你几乎可以亲手触摸公司的业绩。他表示,“肯定可以谈成功。对于任何技术专业人士来说,这样的提议真是太棒了。”
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。