工业机器人是个发展多年,相对成熟,且市场应用规模逐渐增长的市场,但在具体应用中,还存在很多亟待解决的问题,尤其是在工业机器人的易用性方面。
MUJIN是一家专注于为工业机器人提供通用型一体化解决方案的日本企业,创办于2011年。其创始人Issei Takino此前是精密工具制造商Iscar公司的一名销售经理,多年奔波于日本、韩国、中国的工厂中,使他既觉察到了工业机器人的发展趋势,也看到了隐藏其中的问题。
2014年,MUJIN获得了UTEC(University of Tokyo Edge Capita)领投,JAFCO跟投的600万美元B轮融资,其中JAFCO出于未知原因,并未对外公布该项投资行为。
Issei Takino 在2011年看到的趋势,得到了证券行业分析师和政策的佐证。据财富证券发布的报告显示,2015年全球工业机器人总销量达到24.8万台,并预测这个数字将在2018年上升至40万台。中国政府也在去年回应了这一趋势:《机器人产业发展规划( 2016-2020年)》中指出,到2020年自主品牌工业机器人年产量将达到10万台。
与市场趋势利好相悖的是,企业主采买工业机器人依然不是一件“轻松”的事情。雷锋网(公众号:雷锋网)了解到,就目前现状而言,业界认为工业机器人在应用中还存在以下缺陷:
易用性较差
让工业机器人“干活”有两种方式:一种是编程输入型,一种是示教输入型。由于机器人结构复杂,使用工业机器人的一线工人经过严格和复杂的培训,操作非常繁琐,这为企业造成了巨大的成本。
无法应对环境变化
机器人与人类最大的区别就在于对环境的感知,即便近几年人工智能在不断发展,但机器人对于环境的感知程度依然很弱。一旦环境突变,非常有可能造成机器人大面积瘫痪,甚至引发工厂安全事故。
安全性存疑
工业机器人在操作过程中,有时会与人类实际接触,尤其是协作机器人,若设计时出现安全漏洞,被黑客劫持或,或者在运动规划时发生计算错误,非常容易发生机器伤人的意外。
这三个问题的核心其实都在于控制。
为了解决这些问题,Issei Takino 找来毕业于卡耐基梅隆大学的Rosen Diankov 担任 MUJIN CTO。Rosen Diankov 在运动规划领域钻研颇深,其博士论文即围绕此问题展开。或许很多人不知道他的名字,但从事这个行业的人基本都离不开开源项目 OpenRAVE,而 Rosen Diankov 便是这个开源项目的建立者和维护者。
从 OpenRAVE 的官网上可以看到,其目标定位于使工业机器人自动化,这与MUJIN其实有着共同的方向,相信这也是Issei Takino能将他拉入伙的原因。而在MUJIN的官网,新智造也发现,官方并不避讳这一点,并且大方的承认OpenRAVE对于MUJIN的重要性:
MUJIN的创新技术始于 Rosen Diankov 博士( CTO ),他于2006年发明了机器人运动规划库( OpenRAVE)。由于传统机器人已经依赖于昂贵而笨重的手动教学,Diankov 博士认识到,工业需要更多的自主机器人,能够执行不止重复的任务。这一概念在研究人员中传播,他们也承认这是必要的技术。最终,OpenRAVE成为世界上最流行的机器人运动规划库。
在 Rosen Diankov的技术支持下,MUJIN研发了Mujin Controller,该控制器能够通过以太网或接口与机器人制造商的API接口连接,可以实现实时的机器人系统控制,并能进行实时碰撞检测和避免。更值得一提的是,Mujin Controller不受限于机器人的模型、轴的数目或机械结构。
除机器人控制器技术、Mujin Controller外,MUJIN还为企业提供用于延长机器人寿命的翻新产品和建议。另外,MUJIN目前正在创建下一代的垃圾箱智能系统,同样使用Mujin Controller 中的碰撞避免和实时运动规划技术,可在三维中识别目标物体,实时利用这些信息来规划机器人运动,完成一个给定任务(如分捡垃圾),完全避免碰撞。
目前,MUJIN已经拿到了一些国际大厂的订单,包括三菱、安川、DENSO、Custom Robot、Canon、HONDA等十余家,暂时还没有新一轮的融资消息。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。