至顶网CIO与应用频道 09月11日 北京消息:在“人工智能即将引发世界末日”的说法甚嚣尘上的大环境里,理性的声音很容易被淹没。为此,今年年初,我与同事Matt Cain决定写一篇研究报告,以期在所有喧嚣的“末日悲观论”中发出理智的信号。
在Gartner题为《通过数字化工作场所项目利用人工智能增强人类技能而非取代》的研究报告中,我们重点提出了各企业机构利用人工智能增强人类能力,并进而构筑新型能力、拥抱新工作模式的若干途径。
我们认为,将人工智能引入工作场所的确是一场天翻地覆的转变。在我们为每一个垂直领域提供服务时,这一举动将带来飞跃性改变。但是,究竟发生了哪些变化,而且为什么我们应该加以关注呢?
变化一:人工智能要求工作者更加人性化;讽刺的是,这并非我们想要的。
人工智能其中一个被低估的优势就是它帮助人类从事与生俱来(或者至少应该)擅长的工作,以及支持机器完成其精通的任务。这种“关注点分离”(separation of concerns)导致了一个类似“半人半马”的怪象:一方面增强人类能力,而一方面又将机械性、重复性的任务交由机器完成。
这就是第一个悖论——我们不愿接受这种变化——它将导致我们的工作方式更加人性化。但是,您可能会问原因何在?
这是因为成为“真正的人类”很难做到。这要求具备想象力、移情、好奇心、批判性思维、激情、创造力——您懂的!人性化就要避开例行任务,即:只与生产力相关的任务。人性化需要我们开展创造性工作,这是只能由人类完成的工作。事实上,这些工作是均涉及充分运用个人专长与独特行为(例如:由于上次的愉快体验,您打算走进那家餐馆并依然希望某位服务员提供服务)。
部分原因在于——随着我们逐渐长大,由于标准化教育以及上令下行的就业性质,我们的创造力(大量)消失了。因此,对人类能力的要求越低,我们的生活似乎将更加轻松。如需深入了解详情,请查阅《学校教育是否扼杀了创造力?》(个人愚见,这是迄今最好的TED演讲)。
想象力比知识更重要
——阿尔伯特·爱因斯坦
变化二:人工智能要求人类“从外到内”地看待工作
将设计思维方法应用到我们的工作之中时,需要以退为进,重新思考客户的实际问题,并且确定在哪些场景下机器可以最好地协助人类为客户提供支持。这相当于非常规(需要更高认知能力)与常规(机械、可重复)任务。该方法揭示了第二个悖论——重新设想自己的工作,以期被取代的工作者将难以如愿,但他们会影响所在企业的人工智能战略方向。
变化三:利用人工智能技术补充人类技能将提高决策与流程效率
人工智能引发变革的主要目标之一是要让人类成为“请求-响应链”(request-response chain)内中继信息的中间人。在这种情况下,除了从记录系统中提取数据外,人类贡献的价值很少,因此主要向非中介化发展(参见下图)。
我们应提高人类的作用,借助独一无二的业务与客户知识来提供个性化洞察,同时将提取重复性信息的责任交由基于人工智能的虚拟助理处理。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。