Gartner 2022年中国信息和通信技术成熟度曲线显示,机器人流程自动化(RPA)在国内的发展势头逐渐增强。如果运用得当,RPA可以帮助用户建立自动化工作流完成任务,提高企业机构生产率。
然而实际上很多RPA项目并不顺利,其中一个原因在于IT领导者使用这项技术的场景可能并不合适。此外,RPA供应商筛选流程也很复杂,领导者可能缺乏必要的资源或企业级支持来做好这项工作。
图1总结了中国RPA项目需要避开的三大陷阱。
使用四大原则筛选用例
RPA是众多自动化技术中的一种,其设计初衷是实现任务自动化。IT领导者如果确认RPA是实现自动化需求的最佳工具,则需要选出最合适部署RPA的任务自动化场景。
理想情况下,任何流程只要结构清晰、重复性强、规则明确,都可以使用RPA来完成自动化。为选出最佳应用场景,领导者再评估中需要考虑以下四个关键原则:
建立周密的评估标准
为准确评估RPA供应商的能力并选出最佳合作伙伴,国内IT领导者应在供应商评选开始前以及过程中与各干系人积极协商沟通,优先关注以下指标。
集成能力。IT领导者一定要确保供应商软件与自身IT环境可以兼容。为此,需要列举可能会应用到RPA的全部现有系统和应用,然后将其分为三类——经常使用的大众软件、偶尔使用的一般软件、很少使用的小众软件。
用户体验。终端用户对于自身工作的流程细节,有非常独到的见解。因此,IT领导者需要与业务终端客户和应用技术专业人员沟通,获取产品需求反馈。
用户体验在中国尤其重要。本地RPA供应商更了解国内用户,所以更容易做出中国公民开发者所需的直观产品用户界面(UI)。同时,本地供应商也更善于在整个销售和支持期间提供中文服务。
投资回报率和总体拥有成本。考虑到项目预算的限制,国内IT领导者往往青睐价格最低的RPA产品。售价低固然有吸引力,但并不等于投资回报率高。低价产品如果缺少关键功能,长期维护和人力成本会非常高。总之,要控制住选择最低价的冲动。
长期合作潜力。很多国内IT领导者低估了企业需要与RPA供应商合作的时间。RPA从部署到成熟,往往需要数年时间。因此,领导者需要判断供应商是否具有成为长期合作伙伴的潜力。合格的供应商不仅能覆盖短期自动化需求,还需要具备与企业发展战略和长期目标相匹配的RPA产品发展愿景。
建立RPA治理模型
为将RPA项目推向成熟阶段,完成企业机构内部的RPA推广,IT领导者需要建立RPA治理模型。为选出最合理的RPA治理模式,国内IT领导者需要优先关注以下三个方面:
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。