5月5日,“2017中国工业大数据大会·钱塘峰会”在杭州国际博览中心举办。本届峰会以“数据驱动创新 融合引领变革”为主题,围绕工业大数据展开分享与交流。阿里巴巴集团副总裁刘松,以“阿里巴巴云上工业智能模式与实践“为题探讨了自己的看法。
以下为嘉宾演讲实录:
大家好!我就就直入主题,快速说一下过去一年半阿里巴巴在云上工业智能的实践。第一个,提工业互联网与智能制造的大前提,我们和工业互联网的余晓晖院长一起努力,广义上看,工业互联网有三个重要的积极因素:一是我们有未来五到十年5亿中产阶级,消费升级;二是我们有每年毕业全球37%的理工毕业生;三是我们有全产业链的制造链,这是三个最重要的宏观因素。但我们看汉诺威的工业展也看出了两个基本短板,就是工业数据的基本能力的缺失,还有一个是大家提得比较少的,就是在含消费在内的工业制造企业,在那一刻精细化客户导向缺乏,包括像海尔、联想这样的大企业,他们把货丢到供应商就结束了。所以,今天工业互联网和智能制造,包含下面的工业大数据作为承载,最重要的是解决两个短板的问题,在消费上侧要解决客户精细化导向的问题,在生产侧要解决核心竞争力的问题。今天我重点讲生产侧的问题。
去年开始阿里有很多专家在投入,我们在消费互联网的大数据专家、人工智能专家,进入工厂,经过一年多的探索,我们发现生产侧有巨大的提升。在协鑫光伏生产厂,前面很多专家讲了很多特征,关键是机器学习如何优化离散制造业的上千个参数的问题,细节就不讲了。包括一直到工艺生产的生产线的参数,最后在生产厂里发现对于切割光伏的切片来看,导轮是最核心的因素。大家注意到导轮的温度都非常清楚,根据这个调整,通过算法回归,就解决了一个厂里5%到6%的成品率提升。现场的工人也很惊讶,因为他们努力了两三年也没有提升1%,他们意识到外行的机器学习专家加上算法学习,是可以破解一些综合性生产的问题。
关键是这些核心数据甬道中策橡胶,做和光伏完全不相关的关系,成品率也同样获得了成倍的提升,学习成本从以前的6个月变成了1个月,我们就认识到通用的智能和算法可能会破解很多工业里知识垂直壁垒的问题。包括在新能源领域、物流调度,本来这是互联网总擅长的算法。就是饿了么的算法用到物流里,优化了多时创窗户的智能优化VRP的问题。更广义的说今天有大数据和物联网,物联网采集,大数据是燃料,但最大变化是深度学习这个新的变量,让我们解决工业里新的NP问题,像城市交通的问题,生产工艺的问题,这是去年有大数据深度学习之后的新变化。
广义的来看,我们认为数据智能在工业界、工业工厂里,企业制造最需要的人、机、料、法、环五个环节里,深度学习和大数据采集有巨大的跨界化学反应和空间。我们的思考方式是从去年阿里做杭州的城市大脑解决智能交通问题的时候,到今年4月份,我们发布了工业大脑的概念。工业大脑在什么位置呢?前面专家讲了各个领域的问题,真正的问题是用什么模式解决。因为工业的问题极度分散,领域跨界,链条非常长,从下面有一群传感器的人,再有通讯协议,再到安全,再到云端,云这边还有算法专家、业务专家,怎么用一个模式解决这个问题。杭州城市大脑和十几个技术供应商,把整个杭州所有的数据进行了统一标准,工业大脑是开放式的框架,例如在整个广义的工业界里,推出相对通用的垂直,再去和合作伙伴形成一个生态体系。
所以,我们认为从信息化到智能化,从智能化进入重新思考模式推进的问题,现在看这个模式就是工业大脑的模式,当然这是开放式的结构,因为阿里是做平台,那些垂直的领域还需要和包括三一、信通院做深入合作,但我们音乐发现结合大数据、新一代的人工智能和物联网,需要有一个结合模式往前推进,需要一个要素机制才能进来。从互联网的角度看,这个模式能够覆盖多少人口;交易频度有多高;是不是工人和制造企业的刚需;有没有网络效应,要通过大脑模式去解决。我们注意到有些智能电表的物联网应用,有一个死穴就是没有交易频度,设备都铺好了,技术问题也解决了,但谁会用手机看水表呢?这里面有很多伪问题,所以把问题考虑好,要以大脑方式推进。
我们和浙江经信委一起推动10万企业上云,小型企业解决的是移动化的问题,中型企业解决的是互联网化的问题,大型企业不管哪个行业解决的是智能化问题,终极目标是解决生产过程、销售过程,以及触达中国十几亿消费者消费的重大问题。我们深度参与了浙江省车书记到冯省长对于10万企业上云,头部解决是数据智能,工业大脑的问题;中间解决互联网商业模式的问题,最下面解决移动化,包括通过钉钉、SaaS模式服务于企业升级的问题。我的演讲都到这里。谢谢!
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。