至顶网CIO与CTO频道 09月02日 人物访谈(文/王聪彬):“整合比新建要复杂的更多,因为我们要把每一个环节像拼积木一样搭好,这是一个非常复杂的过程。”作为延锋汽车饰件系统有限公司IT高级总监,蔡华东最近正在为集团IT整合奔走。
延锋汽车饰件系统有限公司(以下简称“延锋”)是上汽集团下属零部件企业华域汽车全资子公司,是国内最大的汽车零部件企业之一, 2018年汇总口径销售额超过1300亿。延锋下属六大业务单元,覆盖内饰、座椅、外饰、电子、被动安全、新业务。
不同于整车厂,延锋最主要的特点是工厂数量多,全球拥有将近300家工厂,其中100家左右在海外,每一家工厂规模不大。这也让IT运维工作难上加难,所以延锋的首要任务就是统一IT ,但是未来应用系统的整合直接关系到用户的日常的流程,蔡华东也在思考,如何能更平滑的整合,让客户无感知的得到服务。
延锋目前正在集中所有的流程,构建统一的架构、统一的标准、统一的运维工具以及运维团队。这正是蔡华东在之前业务单元里所使用的IT运维方法论,现如今他又把这套方法论带到了集团进行统一IT运维的规划。
“在有存量的情况下开始建设统一的IT是一个复杂的过程,统一最先能看到效果的就是运维,这也是一个突破口。”蔡华东希望通过看得见摸得着的提升来让整合更加快速的推进,所以在运维工具选择上,他找到了曾经在下属业务单元一起战斗过的老朋友Ivanti实现集团的IT服务管理,而且其还非常适合延锋的全球化业务发展。
延锋汽车饰件系统有限公司IT高级总监蔡华东
统一IT创造整合价值
延锋下属每个业务单元都有自己的发展规划,业务间还没有形成有效的协同,在管理水平上也是参差不齐,加上海外业务的加速发展。所以在管理上集团也开启了大集中战略,包括IT、财务、人事、采购等,形成标准化,协同的管控。
在IT层面,原有业务单元都有自己既有的IT,想要统一管理是一个不小的挑战。通过调研分析,最终决定将能够共享的服务全部集中到总部,像基础架构、集团型应用等,一些具有业务特色的应用,像本地需求分析等应用则留在原业务单元。
蔡华东认为企业IT发展可以分为三个阶段,第一、效率IT,基础设施和基础应用的部署以提升效率为主;第二、流程IT,构建各种系统,任何一个系统都是一个或多个流程;第三、数据IT,通过数据分析指导企业运营。
在既有情况下整合就需要将前几个阶段同步进行,延锋整合的第一步是统一的基础架构,将网络ID集中起来,形成统一的ID,然后对防火墙进行集中设置。同时集团也正在建设统一的数据中心,预计明年将投入使用,这样就可以在统一的基础架构上发展应用和数据。
在流程上,通过将整合好的流程进行抽离,例如某业务流程系统选择一个能够水平覆盖所有业务单元的供应商,各业务单元通过接口接入到同一个系统中,之后也将各个系统进行逐步整合。未来对于同种类似场景但又难以统一的流程,也会考虑建设中台和微服务进行整合。
四步成就统一运维管理
有了统一的IT,还要有统一的流程和运维方法论,最后就是统一的运维工具。蔡华东把曾在下属业务单元IT运维的经验带到了集团,规划了集团IT运维的四个阶段。
第一阶段:筹建服务台,整体把控IT资源、优化资源配置,规范运维管理流程;
第二阶段:CMDB(配置管理数据库)建设,除了给财务同步资产信息,更重要的是给IT运维自动化做参考;
第三阶段:容量管理、配置管理,根据当前和未来的业务需求,以合理的成本为IT服务运作配备所需的IT资源,以及ITAM(IT资产管理)、安全等全方位的IT建设;
第四阶段:贯标(通过ISO标准),提高企业市场竞争力,保持和巩固企业市场竞争优势。
第一阶段通过Ivanti建设IT控制台,从2019年3月开始立项,9月正式上线。蔡华东表示,虽然各个业务还没有完全统一,但所有业务实现了工作界面的统一,各业务单元就能在同一个系统中协同工作。
第二阶段也在规划中,因为CMDB可以让管理层对集团内部的所有数字资产了如指掌,什么物理资产在哪里,什么应用在哪些物理资产之上都一目了然,让所有的事件影响分析、变更管理都有据可循。而且延锋在建设CMDB的同时还加入了一些自动化工具和开源软件。
根据蔡华东的经验,CMDB项目很容易失败,之前IT人员去工厂为服务器配置IP地址、主机名等信息,但几个月后很多项都改变了,所以配置也就失效了。而自动化工具可以自动创建出一个关联图,并将新设备自动抓取到图中,以更好的实现自动化运维。
第三阶段更多是流程和自动化的构建,原来容量管理更多是通过监控进行人为调整,自动监控则可以让系统实现可用性管理。
自动化运维从监控开始
在延锋IT整合的过程中,自动化运维的理念一直贯彻始终,第一阶段控制台建设就已经实现一些初步的自动化,例如监控软件监测到某台服务器出现问题,可以自动在控制台建立工单。到第二阶段将以CMDB为核心,以服务对象提供自动化。
通过CMDB延锋可以看到每一个机房有哪些IT设备,甚至产线上有多少扫描枪,同时在应用层面也可以看到配置项,配置了哪些账号和应用,形成硬件和应用的协同。
在工厂内更多的故障其实来源于工厂设备的故障,例如生产线上扫码打印机故障,其中可能是网络、服务器、数据库等诸多问题产生,通过人为排查效率很低,在CMDB中根据其中的逻辑,延锋可以自动筛选出条码打印机相关的所有事项,快速找到问题的根源。
蔡华东在曾经的业务单元遇到最多的就是生产线卡顿现象,零部件厂商的生产节拍比整车厂要快得多,所以卡顿对于业务开展造成了一定影响。但是整个链条上涉及的系统和流程有很多,这也造成卡顿的原因很难排查。
一个例子是,几年前一个工厂频繁发生卡顿,但这种卡顿又是无规律的,该业务单元成立了专家小组,经过一个半月的排查最终找到是程序开发中的一个问题。蔡华东说,在正常运行情况下是很难找到卡顿的原因,但是卡顿又经常无规律发生,必须在卡顿发生时进行追踪,而在实现自动化运维后30秒就可以发现问题从而快速解决问题。
随着集团IT逐步扩大发展,监控也将成为未来保障延锋IT服务灵活性的重要抓手,因为只有及时找到问题才能保证制造业的生产命脉。而且全方位的监控,还可以进行统一的数据分析,让运维向着智能化的方向发展。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。