至顶网CIO与应用频道 01月10日 北京消息:增强现实(AR)技术目前已经应用于多个领域,从医疗护理、体育、制造业再到现场服务等,且仍有巨大的潜力。目光长远的企业探索AR技术的目的却并不在于完成任务或简化项目,而是在考虑如何能将AR技术应用于传授知识,以应对劳动力的老龄化。
世界经济论坛(World Economic Forum)和德勤会计师事务所(Deloitte)联合开展的一项研究表明,全球的制造业可能会面临一千万的劳动力短缺,其中美国占两百万。有意思的是,美国的技能型制造工平均年龄为56岁。随着制造业和相关现场服务业的技能型工人踏入退休年龄,企业必须寻找新的方式来应对劳动力短缺问题。
在知识传授方面,要让老一代有经验的工人将他们的技能传授给下一代,AR技术能够发挥什么样的作用呢?在“是敌是友——AR与物联网(IoT)之间的关系”(可请求获取)网络研讨会中,专家组成员围绕这些技术讨论了多个话题,包括在有经验的老一代现场服务工人步入退休年龄、新一代工人接管相关工作过程中的知识传授问题。
现场服务专家技师所掌握的知识,大都存储在他们的大脑中——凭借多年的经验,他们知道怎么诊断问题、解决问题,很少需要查询手册或寻求帮助。婴儿潮一代达到退休年龄之时,千禧一代和Z一代能够顶上吗?知识的传授或可借助于AR这样的技术。而且,这些年轻人在日常生活中已经习惯使用技术,所以,技术也可以有效应用于工作之中。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。