当 ChatGPT 首次亮相、人工智能开始兴起时,我们正在为 ServiceMax 寻找新的方法,以帮助即将退休的现场服务技术人员进行知识传承。这是我们的客户面临的最大挑战之一,而手册和数据库等传统方法无法解决这一问题。 因此,使用大型语言模型在数据集上训练系统让我们大开眼界。 我们立刻意识到这种方法也适用于 ServiceMax。几个月后,我们推出了 ServiceMax AI 客户测试计划。ServiceMax AI 可以访问存储在 ServiceMax 实例中的所有数据,通过自然语言和易于使用的聊天界面与技术人员互动,并通过专业代理完成任务。
我们的目标是创造一种体验,让您感觉就像在与其他人类技术人员、调度员或操作员一起工作。 技术人员可以输入或提出问题,系统就会与幕后的代理一起工作。 我们首先关注三个代理:
当这些代理结合在一起时,神奇的事情就发生了。ServiceMax AI 可以动态选择最相关的代理来回答给定的问题,就像经验丰富的技术人员可以利用自己的记忆和知识来排除故障一样。 真正使其与众不同的,是这些代理如何在幕后协同工作,并得到当今人工智能技术的支持,如检索增强生成(RAG)。我们构建了一个完整的协调和推理层,利用 RAG与代理进行交互,以获得所需的答案,从而对整个问题作出回应。
传统上,软件访问数据的方式是确定性的——使用仅适用于特定查询的预定义 API。当问题出乎意料或存在细微差别时,这种僵化的方法就会受到限制。
因此,我们构建的 ServiceMax AI 能够以非确定的方式访问数据,这也就意味着人工智能不依赖于僵化的 API 结构。我们没有预先定义每一种可能的数据检索方法,而是“教会”系统如何在 ServiceMax 中动态访问和检索信息。它模仿人类的思维过程——调用经验、分析上下文并实时提供有见地的答案。
正所谓:授人以鱼不如授人以渔。 这正是人工智能技术的本质所在:通过建立一个更加直观和高效的基础,使得我们能够更容易地访问正确的数据,从而为我们的客户释放现场服务知识的真正潜力。
考虑到现场技术人员的日常工作场景,显然聊天是最理想的模式。聊天的方式之所以强大,是因为它与大多数人已经习惯的交流方式一致。技术人员总是忙碌奔波的——无论是在卡车上、工作现场还是在野外工作。 他们都没有时间浏览复杂的系统或筛选冗长的文档。 他们需要快速获得有用的信息,以他们乐于接受、习惯的方式呈现。
ServiceMax AI Chat为技术人员提供了这种自然、高效和熟悉的互动方式。就像他们在个人生活中使用 ChatGPT 和其他人工智能工具一样,他们现在也可以在专业工作中使用专为现场服务设计的系统,获得同样直观的聊天体验。只需输入几个问题,他们就能快速获得关键信息,就像他们之前向同事求助一样。
我们很高兴能将 ServiceMax AI 带到现场,看看它是如何发展的。 经过几个月的客户测试,我们对它如何融入技术人员的工作流程感到鼓舞,但这仅仅是个开始。人工智能的发展日新月异,随着越来越多的客户采用它,我们将根据实际反馈继续完善和改进 ServiceMax AI。
我们希望您有机会试用 ServiceMax AI。 同时,如果您发现人工智能正在以其他有趣的方式影响现场服务,我们也很乐意听取您的意见!
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。