至顶网CIO与应用频道 12月07日 人物访谈:11月28日,由中央网信办、工业和信息化部指导,湖南省人民政府、中国工程院、中国科学技术协会、国防科技大学、中国电子信息产业集团有限公司主办,工信部装备司、湖南省工信厅、长沙市人民政府、中电工业互联网有限公司承办,至顶网和中国制造千人会协办的智能制造融合创新主题峰会在长沙国际会展中心举行。
用友网络科技股份有限公司高级副总裁兼高端业务事业群总裁王健在大会上发表演讲,并在会后接受了至顶网独家专访。以下为访谈实录(内容经至顶网编辑整理,未经允许谢绝转载):
主持人:智能制造是国家在推的重要的概念,您怎么理解智能制造?
王健:智能制造\工业互联,这些应该是一个整体性的概念。国家对这个事情比较重视,以此推动整体的产业升级。信息技术走到今天,对制造业企业也带来了转型的新机会。
首先智能制造在最基础层,设备这个层次。现在也在提云计算,设备物联,设备这一层首先要连接起来,让设备能够比如说把它真正优化到位,同时比较好的预防风险事故,更好监控,让环境设备本身的参数有机地结合在一起。其次整个生产过程,比如说智能工厂、车间,这个过程的自动化流程一体化,包括整体的数据的智能化。
再进一步是对企业进行经营管理,生产管控形成一体,从整个大的生产协同,这是从应用的角度看。再下一步智能制造涉及到外部的东西,包括生产相关的过程监管。再往外展跟物联网联结在一起,跟产业链的相关协同。产业互联这个概念,也是制造业,制造向外展开的一个范畴,进一步把企业本身的应用,向企业的上下游产业链进一步智慧化。
这个过程中还有还有很多技术,特别是今天像谈到数据,连接数据是很重要的一些关键的关键点,有效的连接,建立大数据模型,实现深度领域的连接更有意义。
用友网络科技股份有限公司高级副总裁兼高端业务事业群总裁王健
主持人:在用友网络看来制造业转型需要注意什么?有哪些经验分享?
王健:不同的企业从不同的点去做,选择点也不一样。有的企业更多的在企业跟外部连接好以后如何从外部思维做好整合,像一些消费品企业。然后有一些设备问题,设备在整个生产当中占的作用比较大,生产现场的数字化智能化。因此,不同类型的企业不同阶段关注点不一样,作为企业来讲首先要有一个整体性的思考和目标,具体做的时候还是一步一步做。
主持人:企业应该如何转变思维接受新的技术?
王健:今天信息技术发展很快,从信息化到数字化智能化涉及很多技术。首先一个数据的概念,整个企业的数据量可能是都有几倍甚至几个数量级的增长。数据以前主要记录一个业务过程的结果为主,今天整个过程中的具体的一些细的点都在记载,都在实际的动作过程中有反应,具体行为有反应,这个数据跟以前大不一样,基础支撑让它有条件很及时地获取这些数据。今天让它可以分解很多事情,优化很多事情。
过去是点的智能,今天智能相关的技术应用,特别是数据智能应用到企业整体当中,数据智能把整个制造过程,或者整个设备完全的数据,整个企业内部外部结合到一起产生智能化。
主持人:用友如何帮助企业实现数字化转型?
王健:首先,用友有一个重要的平台是基于微服务架构,基于整个互联网云计算的支撑,包括大数据交易相关支撑,数据处理能力,整个获取和处理能力,都是很重要的平台体现。在这个平台上有IOT平台,和外围的设备连接。在支撑基础上搭建应用,包括用友核心的应用,应用的打通融合,构建企业整体的架构。
主持人:用友在企业数字化转型中有哪些优势?
王健:用友的核心在企业服务领域。目前有400多万客户,制造业企业中型以上40多万家。今天整个智能制造在进一步深化的过程当中,因为我们有机会跟他们一起合作,做深入的智能制造领域的耕耘和探索,创造价值。这是我们一个很重要特色。当然我们也有平台基础,现在互联网一些公司很多也在考虑做智能制造,工业互联网,我们可能更懂的是理解企业。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。