随着技术变得越来越人性化,在工作场所保持以人为本的方法也变得至关重要。
生成式AI能够重塑组织的方方面面。企业正在意识到生成式它的潜力,但在将生成式AI战略从“展现希望”转向“盈利”之前,他们需要回答几个和技术相关的问题:我是否拥有适合所在行业和职能的大型语言模型?我的数据基础是否足够强大来支持它?我是否拥有合适的企业架构来充分利用新的或者不断变化的模型?
这些都是艰巨但并非不可克服的技术挑战。但如果组织忽视了这一前所未有的技术飞跃中最大的因素:他们的员工,那么一切都将毫无意义。
当谈到生成AI时,对员工的投资要多于对技术的投资。
埃森哲《2024年技术愿景》报告中探讨了领先企业是如何通过技术正在变得更加人性化这一共同主线开启一场迈向价值、能力和战略的新时代竞赛。
这为企业带来了广泛的新机遇,例如释放更大的人类潜力、生产力和创造力,同时使产品和组织更容易获得和多样化,而生成式AI将所有这些机会结合在一起,为了充分利用它,我们需要将注意力转向人力资本。
信任差距
生成式AI能够重塑工作的本质,重塑企业为员工和客户提供价值和更好体验的方式。但潜力与现实之间是存在信任差距的。埃森哲最近关于生成式AI时代工作性质的研究表明,95%的受访员工表示,他们看到了与生成式AI展开合作能带来的价值,有82%的受访者表示,他们已经对这项技术有了一定的了解。然而,他们最大的担忧是信任他们的雇主:58%的受访者表示,AI正在增加他们工作的不安全感,57%的受访者表示,他们需要弄清楚这项技术对他们的职业意味着什么。
对于组织而言,从现有员工入手并揭开AI开发的神秘面纱至关重要。保持战略透明,分享AI如何增强人类能力的示例,并强调组织创造的效益将如何用于激励培训和发展。
首先,要和员工仔细谈论AI时代。是的,AI可以提高生产力和产能,但企业无法通过即插即用式的AI在短期内提高利润,它的有效性取决于参与和深思熟虑的人类输入。
例如,在客户服务领域,由于自动化和人工智能,许多人的角色正在发生变化。由于这类员工大部分时间都花在和客户交谈上,因此他们拥有丰富的语言和沟通技巧,善于在多种情况下与客户合作,找到双方都满意的解决方案。现在,他们可能会发现,他们的工作将越来越多地涉及到把更多在线请求转交给聊天机器人。
他们的经验和技能赋予了他们新的职能:提示工程,即设计和完善文本提示输入以改进AI模型的输出过程。我们甚至发现,前客户服务员工通常比程序员更擅长与大型语言模型合作和互动。更准确的大型语言模型可以带来更准确的AI解决方案,对客户服务和企业的利润产生积极的影响。
尽管如此,埃森哲的调查显示,虽然94%的高管今年打算增加技术投资,但其中只有26%的投资将重点用于劳动力再培训。到2023年,只有5%的企业对全体员工进行了使用生成式AI相关的的培训。我们鼓励企业利用新技能来加强自己的员工队伍,这些技能对于充分利用技术是不可或缺的。这些数字表明,我们在劳动力再培训方面面临着紧迫性。
多元化红利
正如埃森哲的技术愿景报告指出的那样,我们第一次看到一代技术在设计和本质上都更为直观,展示了更接近人类的智能,可以轻松集成到我们生活的各个方面。随着这些进步,企业需要确保在开发此类工具时内置了负责任的AI原则,并在治理、风险管理、问责制和可解释性方面发挥作用。
因此,多元化的员工队伍对于帮助企业发现和纠正大型语言模型的偏见、幻觉以及其他可能影响信任和透明度的意外后果至关重要。已经实施了D&I计划的企业将处于有利地位,可以建立一个道德的AI框架,鼓励负责任的协作智能。这有利于企业的生产力,同时也有助于确保生成式AI解决方案的安全性、适当的治理和合规性。
通过安全建立信任
生成式AI是一项民主化的技术,能够快速使整个企业的人员自下而上地重新定义业务流程和工作流程,速度比组织创建正式程序的速度还要快。你可以想想智能手机的发展历程。企业花了很长时间才了解人们使用智能手机的方式和地点,但最终他们意识到,增加员工的流动性和让员工在任何地方都可以工作,将有助于提高生产力。
这给企业带来了一个需要解决的有趣问题。人们非常热衷于使用这些工具,他们在个人生活中使用这些工具,并期望在工作场所中也使用类似的工具。但企业需要对其使用方式保持警惕,以确保不会将企业或数据置于风险之中;当智能手机的使用仍处于发展阶段时,大多数组织在制定政策和支持安全标准方面进展十分缓慢,这是我们不能再犯的错误。
AI带来了全新的威胁,使得保护信息和机密性的任务变得和过去截然不同。因此,企业将面临挑战,他们需要快速但谨慎地采取行动,同时知道竞争对手可能不会有相同的担忧或施加相同的“护栏”。
好处是,AI时代的安全性是在人与技术之间建立信任的一种直接且重要的方式。企业需要将安全视为一个推动因素,而不是一种限制。制定强有力的安全标准并明确传达其价值,可能是在企业与其客户之间建立信任的一个最有效的方法,尤其是在技术动荡时期。
企业正在热情地迈向AI的未来,根据研究,生成式AI有望带来自农业和工业革命以来最显着的经济提升和工作变革,但在未来的道路上企业会发现,AI战略的成功从根本上取决于员工。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。