突如其来的新冠病毒大流行迅速重塑了我们的工作方式。各管理团队和人力资源部门迅速采取行动,以使刚开始远程办公的员工投入工作和维持业务连续性。
虽然大多数组织已经摆脱了最初的员工生产力问题,但在“新常态”下,仍有一些战略考虑和痛点需要解决,其中最突出的问题是,前新冠疫情时期的劳动力问题增多,新的劳动力挑战开始逐渐渗入长期的数字化战略。
这两种情况关系到很多行业,但对实业公司的影响可能更大。企业需要赋能一线工人,让其接纳已被新冠疫情严重影响的工作环境。增强现实(AR)很可能就是其中缺失的一环,它提供成熟的技术来解决产业劳动力面临的新问题和老问题,并将生产力提高到不可思议的水平。
现有的劳动力问题并未消失,反而正在加剧
虽然一些最重要的优先事项可能由于疫情发生了改变,但它们绝对没有消失,而且在某些情况下变得更加紧迫。
招聘下一代工人和保留专家知识
在疫情高峰期,吸引和留住高素质劳动力的问题变得不那么紧迫,但这样的情况并没有持续太久。制造商们仍在与潜在雇员对其工作的负面看法作斗争,许多人仍然认为制造业就是“在一个肮脏、危险的地方工作,而且几乎不需要动脑筋或有一技之长”。
对制造商而言,该就业难题的另一方面是如何留住人才。由于其他行业在自我推销方面做得更好,而且年长的劳动人才退休时可能会带走他们的专业技能,因此留住人才变得非常困难。
一方面需要招聘下一批人才,另一方面又不可避免地会有经验丰富的工人离开,由此也就形成了一个相当大的技能缺口。有专家预测,在未来十年里,制造业将出现数十万个就业岗位。
新冠疫情只是加剧了本就紧迫的现实难题,因为它限制了现场劳动力的互动,加上强制执行的严格的健康和安全措施,使现场工作跟踪因社交隔离变得极为困难。
在其职业生涯的另一端,许多有经验的制造人员本来是要亲自培训这些新晋员工的,但却无法传授他们的知识,并且很快就会带着他们的隐性知识一起退休。
“新常态”意味着新挑战
几乎在一夜之间,商业经营停止运转,世界各地的生产基地都未能做好充分准备,以应对新冠带来的突发影响。企业争先恐后地执行居家办公的政策,实施旅行禁令,并制定新的健康和安全政策。
有充分证据证明,新冠带来了不可逆转的后果,我们的工作方式也将从此改变。
最近一项CPID调查显示:
英国建筑协会Nationwide甚至允许其13500名员工“在任何地方工作”。开辟了这一未知领域,并通过赋权员工来维持业务连续性和提高生产率的公司将会在未来十年里成为行业领导者。
这意味着企业必须更聪明地利用这些政策来优化他们受限的劳动力,而这对于拥有一线工人的工厂来说则更加困难,因为他们的工作本质上是体力劳动。由于新冠限制了人际合作,在没有适当信息或指导的情况下,许多人只能独自应对关键任务。
这些难以获取的信息可能以书面形式存放在员工办公桌的抽屉里,或仅仅存在于经验丰富的专家的脑中。一线工人在需要的时间和地点缺乏相关的、符合实际情况的最新信息,造成了生产力的严重损失。
增强现实技术助力应对新旧劳动力挑战
增强现实的价值在于,它可以帮助克服大量现有的和新的劳动力挑战——从招聘到培训,再到留住员工等等。
从购物到导航,增强现实功能正在迅速成为支撑日常消费应用的主流技术。人们对增强现实越来越熟悉,这也将逐渐打破就业偏好的界限,因为企业会利用增强现实来驱动前沿企业应用的价值,并动摇以往Z世代对制造业的歧视态度。
鉴于增强现实已被证明有利于学习的有效性,该技术也是培训下一代劳动力的最佳媒介。它让“及时”培训成为可能,只向学习者提供相关的、符合实际情况的信息。
这颠覆了传统的课堂培训模式,即一线工人被迫背诵冗长的产品手册或操作规程“以备不时之需”,而且与任何现实世界的场景分离开来。事实证明,虚拟课堂培训(许多人在新冠疫情期间采用的方式)对改善知识留存和长期技能发展没有什么作用。
利用增强现实对产品信息进行可视化和交互,为学员提供相关的3D数字内容,例如交互式指导服务说明。像谷瑞(美国爱科集团品牌)这样的制造商,在新冠疫情之前,受限于过时的为期一周的培训课程,这样的课程有几百张演示幻灯片,而且与受训者将在现实世界中进行安装的物理设备的互动也很少。通过采用增强现实进行沉浸式培训,谷瑞将新谷物系统的安装时间缩短了60%。
对于新入职的员工和现有员工来说,最新的工作指令对日常工作至关重要,它们可以帮助完成复杂的任务。罗克韦尔自动化通过增强现实的步进式工作指南创建了一个知识库,将新员工的培训时间减少了30%。沃尔沃集团还为其质量保证操作员提供了增强型工作指令,使他们能够在8分钟内完成对高配置复杂发动机的40项质保检查(共200种可能的检查项)。
由于员工退休或转行,公司内存在技能差距和知识外流,捕捉和分散关键工作流的挑战已经越来越大,而新冠使这种信息流更加混乱。
增强现实是捕捉这些专家工作流的最佳方法,并将这些知识快速延伸到工人身上,进行实操培训和任务指导。通过接触这些符合实际的信息,格芯等制造商能够记录并提供标准化和可扩展的工作指令,从而将培训时间缩短40%,并将非计划性停机时间减少25%。
复杂的问题仍然需要无缝的沟通,但新冠和内部专家的稀缺都为挖掘这一重要的支持资源带来了挑战。用以远程辅助的增强现实能够即时连接这些远程专家,提供近距离的现场支持和协作,应对复杂任务。例如,豪顿华在疫情期间面临着调动人员进行现场客户支持的挑战,因此他们选择了远程协助,以获得实时、专业的远程协助支持,迅速解决服务问题。
这些增强现实用例如今带动了巨大的价值增益,随着增强现实变得越来越普遍,下一代应用将创造前所未有的劳动力收益。这包括使用增强现实和空间计算来测量一个工人与另一个工人的距离以保持社交距离,或警告可能与接近中的移动机器人发生碰撞的情况。
最后的思考
新冠疫情对数十万家公司的日常活动提出了重大挑战,一些公司远远比其他公司准备得更好。在数字化转型历程中走得更远的企业,能够更好地保持业务连续性,并帮助其员工过渡到新的工作方式。
接受这种不可避免的劳动力模式的转变,将其视作迈向未来工作方式的一步,这也会进一步拉开顶尖经济参与者和数字落后者之间的距离。各企业会继续将增强现实技术作为当前和未来的技术平台,为其未来的劳动力提供动力。为什么?因为各种商业案例就是充分的证据。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。