清华大学软件学院党委书记、副院长王建民:工业大数据理论与实践

5月5日,“2017中国工业大数据大会·钱塘峰会”在杭州国际博览中心举办。本届峰会以“数据驱动创新 融合引领变革”为主题,围绕工业大数据展开分享与交流。清华大学软件学院党委书记、副院长王建民,以“工业大数据理论与实践“为题探讨了自己的看法。

5月5日,“2017中国工业大数据大会·钱塘峰会”在杭州国际博览中心举办。本届峰会以“数据驱动创新 融合引领变革”为主题,围绕工业大数据展开分享与交流。清华大学软件学院党委书记、副院长王建民,以“工业大数据理论与实践“为题探讨了自己的看法。

 清华大学软件学院党委书记、副院长王建民:工业大数据理论与实践

以下为嘉宾演讲实录:

在两三年前,当时讲到工业大数据的话,很多人会有挑战。工业里有大数据吗?工业的大数据在哪儿?今天通过大家的努力研讨,大家对工业大数据非常支持认可并且在应用。我就简单汇报一下自己对工业大数据的认识。

正如谭建荣院士讲的那样,中国工业的数字化、自动化、信息化不是昨天才开始的,是很长时间,从863到计划开始,当时有HIMSS计算机集成制造系统,那时候工业就在应用计算机,就在产生数据,就在应用数据。今天为什么对工业大数据这么感兴趣,对工业互联网这么感兴趣,对工业智能这么感兴趣,说明一方面工业很重要,另一方面工业遇到了问题。这个问题就是这条曲线所揭示问题,(PPT图示)Gartner回顾了,横轴是国家的制造总值,纵轴是制造业,今天讲工业大数据的时候,还是在制造业上,所以工业是不可避免的下降,这时候大家就讲升级和转型。升级和转型的动力和来源问题,在这样的情况下,全球都在寻找未来制造的出路在哪里,未来工业的出路在哪里。

这张图已经用了十五年,大家看看制造的生命周期大致划分为三个阶段:设计制造阶段、服务保障阶段、回收再利用阶段。也有人划分为四个阶段,徐院士就是划分为四个阶段,今年谭院士讲的设计制造就是在第一阶段。今天没有数据,是过程,今天非常高兴又和陈总会面,他是在一位流程领域深入研究的专家,我非常敬佩。

数据在流程中,在这里和大家分享一个观点,大家拥抱数据的时候,千万不要忘了流程,因为工业制造中的生产组织和价值创造是蕴含在流程中的,没有流程,仅仅有数据,是不创造价值,所以流程和数据要并重。在徐总带领下的工业互联网联盟,探讨了工业领域的模式,在个性化定制、智能化生产、网络化协同、服务化延伸、资源化回收,制造的本质要做到从摇篮到摇篮,制造的生产不是没有限量,要和大家分享这样的观点。

今天有很多企业制造业的专家,信息化在中国,“两化”融合在中国有很长一段历史,现在我国已经变成了新的科技技术,863计划、信息化一直是我们的主题,“两化”融合一直是我们的主题,现在信息化和大数据的关系,简单来说信息化是数据的依次传递,是在收集应用中的,贯穿到各个流程,驱动各个流程业务的有效传递的问题,我们说四个儿也好,五个儿也好,是信息化要做的事情。今天信息化应用是数据化的二次应用,很担心大家把信息化、大数据混为一谈,现在很多人做的工作不是大数据的事,是信息化的事,信息化的事也还没有做好。

我们说大数据要讲究增量,要讲究新,不能把新瓶装老酒。一个非常重要的变化就是以产品交付为起点看今天的生产了,不是从设计制造作为原点,而是把产品交付作为起点,这些就不展开了,大家看GE的报告就清楚了。

正本清源一下,我是做学问的,较较真,工业大数据包括什么?第一就是信息化数据,这是信息化的1.0时代,现在还在走,企业信息化软件、工业软件的核心四大件,PLM、ERP、CRM、SCM是转不动。90年3W发明之后,美国工业在上世纪90年代中期大量用跑互联网,从internet到Internet,很多工业都延伸到了全球。近年来就是机器数据、物联网数据,这是增量,现在说信息化数据、互联网数据再加上物联网数据,来的路上和余总讨论,最近IIC把工业互联网改成了工业物联网,现在工业互联网和工业物联网不区分了,大家都看到了这种变化。

工业大数据国际上解读比我们窄得多,大家可以去查一下维基百科,维基百科对工业大数据的定义就是在工业物联网上。回顾和认真思考一下工业大数据带来的挑战,刚才各位专家都提了,这里从我们的视角来看一下,第一件事情就是以多种类非结构化的数据、过程与BOM图数据、装备监测时序数据为代表工业大数据,呈现出碎片化、高通量、低质量、实时性、因果性的分析求许多。这里面可以看到什么碎片化,怎么解决;什么是高通量,持续数据的分析是工业大数据技术的核心,或者说是时空数据分析是,TSFile是清华大学软件学院开发的一个开源生态,再加上一些自主研制就不展开了。为什么让给贺总呢?因为他是我们早期的合作伙伴,三一的平台建设是清华大学帮助他开发,当时他是自己内部应用。在应用过程中发现大量的工况数据,在Oracel平台上需要的,现在他已经开放出来。

数据的质量是相对的,不是绝对的。有的记一下次数,丢一两个数据没有问题,如果要分析当时机器的原因就要采集到50HZ。工业大数据分析和工业BI的区别,现在很多把商务智能的应用也就等同于工业大数据,这也不妥。尽管涂子沛先生在工业大数据里首先讲的是BI,但工业大数据远远超过了BI,更多的是描述性分析、预测式分析、处方式分析不能混淆,后方的调度和前方的操作不能脱节,某种意义上这也是CPS的核心。

“云”+“端”的分析一定是工业大数据的特点,IDC在2015年讲到“随着边缘计算和端计算的普及,45%的IOT数据将会在边缘就完成了”,但是怎么完成需要和云协同,所以今天讲机器学习,数据驱动的智能核心是要把训练的模型降下来,用到端上应用,把训练放到云乐观上做得越来越好,这是架构理念的问题。

工业大数据分析的因果性方面,前段时间大家把因果性和时序性进行了论述,讲得非常好。在物理模型和数据对应的问题,前段时间,清华大学把机器学习之父进行了演讲,他说推理思维和数据思维的一种结合,数据结合是归纳,推理思维是讲演绎的,今天的人工智能从推理方面讲没有智能,而在数据驱动方面没有智能。他作为奥巴马总统的首席科学家,他说今天的大数据分析推理敢信吗?可信吗?如何验证大数据分析的结果?他说最终大数据分析的可行性问题是工业领域或者说往产业应用里不可逾越的门槛。今天徐宗本院士也提到了这一点。

谭院士讲了前端的创新,我讲一点服务性制造后端的延伸。这件事情也不是新鲜事,大家看美国的波音公司的售后服务做得非常好,到“十一五”的时候,我们发现很多HIMSS工作都是企业内的,能不能走到企业外?那时候我们就关注了MOL的东西。大家讲制造和服务怎么融合,今天想制造有它的特点,服务有它的特点。今天再看服务和制造真的融合了吗?制造是有形的,脑就的,服务是无形的,不可触及,不可耐久,当时看今天的很多服务有形了,很多制造变成很弹性了。怎么把服务和制造结合起来,今天和大家分享一个MRO的东西。

是Maintenance,Repair,Overhaul,哈佛大学一个把互联网分为四个监测、控制、优化、自主。对GE的平台,我认为大家不要过分解读GE,它是一个新一代的MRO平台,是从联网开始的,我们对它过度解读,那是对它还不了解。这是它的Cloud的人很清楚,怎么搭出来的,那是它的新创造,不多。举一个例子,就是北京工业大学中心和K2,所以我就简单讲一下工业大数据和服务性制造的关系。去年11月份《巴黎协定》正式生效了,中国和美国承担着到2030年减排40%的任务,清洁能源成为我们的发展方向。国家能源局的初步统计,2016年全国弃风限电导致损失达到了600亿。我们有这么多供应链,很多电不能上网,有经济下行的原因,还有电的质量问题。金风科技是国家的龙头企业,它的对手就是GE和Vestas,是我们制造不行吗?我们的产品和它相差无几,但我们的风能的风场预测和人家有差距。我们就和金风科技,和跨界数据气象结合,这里也和大家汇报一下,虽然去年G20峰会没有参加,但是清华的气象大数据预报平台的成果在这里得到了运用。因为三年前,我们和国家气象局开发了气象数据处理系统,我们就利用这样的优势和金风一起解决风力的优化问题。

后面就不展开讲了,包括用工业大数据预测的变强层的断裂,包括用工业大数据检测叶片结冰,我们征得了金风的同意,会把数据放在余总发布的工业大数据竞赛的平台上,希望大家利用这个场景做出更多更好的案例。回到前面,工业大数据还是要回到工业做好升级和转型。

最后和大家分享,大数据在从消费互联网向产业互联网渗透,清华大学也正在开发面向高端制造领域的大数据管理系统,一个是航天航空装备创新研发与应用示范,还有互联网工业制造的工业示范。时间关系就汇报到这里!

来源:至顶网CIO与应用频道

0赞

好文章,需要你的鼓励

2017

05/08

10:54

分享

点赞

邮件订阅
白皮书