至顶网CIO与CTO频道 09月02日 人物访谈(文/王聪彬):“整合比新建要复杂的更多,因为我们要把每一个环节像拼积木一样搭好,这是一个非常复杂的过程。”作为延锋汽车饰件系统有限公司IT高级总监,蔡华东最近正在为集团IT整合奔走。
延锋汽车饰件系统有限公司(以下简称“延锋”)是上汽集团下属零部件企业华域汽车全资子公司,是国内最大的汽车零部件企业之一, 2018年汇总口径销售额超过1300亿。延锋下属六大业务单元,覆盖内饰、座椅、外饰、电子、被动安全、新业务。
不同于整车厂,延锋最主要的特点是工厂数量多,全球拥有将近300家工厂,其中100家左右在海外,每一家工厂规模不大。这也让IT运维工作难上加难,所以延锋的首要任务就是统一IT ,但是未来应用系统的整合直接关系到用户的日常的流程,蔡华东也在思考,如何能更平滑的整合,让客户无感知的得到服务。
延锋目前正在集中所有的流程,构建统一的架构、统一的标准、统一的运维工具以及运维团队。这正是蔡华东在之前业务单元里所使用的IT运维方法论,现如今他又把这套方法论带到了集团进行统一IT运维的规划。
“在有存量的情况下开始建设统一的IT是一个复杂的过程,统一最先能看到效果的就是运维,这也是一个突破口。”蔡华东希望通过看得见摸得着的提升来让整合更加快速的推进,所以在运维工具选择上,他找到了曾经在下属业务单元一起战斗过的老朋友Ivanti实现集团的IT服务管理,而且其还非常适合延锋的全球化业务发展。
延锋汽车饰件系统有限公司IT高级总监蔡华东
统一IT创造整合价值
延锋下属每个业务单元都有自己的发展规划,业务间还没有形成有效的协同,在管理水平上也是参差不齐,加上海外业务的加速发展。所以在管理上集团也开启了大集中战略,包括IT、财务、人事、采购等,形成标准化,协同的管控。
在IT层面,原有业务单元都有自己既有的IT,想要统一管理是一个不小的挑战。通过调研分析,最终决定将能够共享的服务全部集中到总部,像基础架构、集团型应用等,一些具有业务特色的应用,像本地需求分析等应用则留在原业务单元。
蔡华东认为企业IT发展可以分为三个阶段,第一、效率IT,基础设施和基础应用的部署以提升效率为主;第二、流程IT,构建各种系统,任何一个系统都是一个或多个流程;第三、数据IT,通过数据分析指导企业运营。
在既有情况下整合就需要将前几个阶段同步进行,延锋整合的第一步是统一的基础架构,将网络ID集中起来,形成统一的ID,然后对防火墙进行集中设置。同时集团也正在建设统一的数据中心,预计明年将投入使用,这样就可以在统一的基础架构上发展应用和数据。
在流程上,通过将整合好的流程进行抽离,例如某业务流程系统选择一个能够水平覆盖所有业务单元的供应商,各业务单元通过接口接入到同一个系统中,之后也将各个系统进行逐步整合。未来对于同种类似场景但又难以统一的流程,也会考虑建设中台和微服务进行整合。
四步成就统一运维管理
有了统一的IT,还要有统一的流程和运维方法论,最后就是统一的运维工具。蔡华东把曾在下属业务单元IT运维的经验带到了集团,规划了集团IT运维的四个阶段。
第一阶段:筹建服务台,整体把控IT资源、优化资源配置,规范运维管理流程;
第二阶段:CMDB(配置管理数据库)建设,除了给财务同步资产信息,更重要的是给IT运维自动化做参考;
第三阶段:容量管理、配置管理,根据当前和未来的业务需求,以合理的成本为IT服务运作配备所需的IT资源,以及ITAM(IT资产管理)、安全等全方位的IT建设;
第四阶段:贯标(通过ISO标准),提高企业市场竞争力,保持和巩固企业市场竞争优势。
第一阶段通过Ivanti建设IT控制台,从2019年3月开始立项,9月正式上线。蔡华东表示,虽然各个业务还没有完全统一,但所有业务实现了工作界面的统一,各业务单元就能在同一个系统中协同工作。
第二阶段也在规划中,因为CMDB可以让管理层对集团内部的所有数字资产了如指掌,什么物理资产在哪里,什么应用在哪些物理资产之上都一目了然,让所有的事件影响分析、变更管理都有据可循。而且延锋在建设CMDB的同时还加入了一些自动化工具和开源软件。
根据蔡华东的经验,CMDB项目很容易失败,之前IT人员去工厂为服务器配置IP地址、主机名等信息,但几个月后很多项都改变了,所以配置也就失效了。而自动化工具可以自动创建出一个关联图,并将新设备自动抓取到图中,以更好的实现自动化运维。
第三阶段更多是流程和自动化的构建,原来容量管理更多是通过监控进行人为调整,自动监控则可以让系统实现可用性管理。
自动化运维从监控开始
在延锋IT整合的过程中,自动化运维的理念一直贯彻始终,第一阶段控制台建设就已经实现一些初步的自动化,例如监控软件监测到某台服务器出现问题,可以自动在控制台建立工单。到第二阶段将以CMDB为核心,以服务对象提供自动化。
通过CMDB延锋可以看到每一个机房有哪些IT设备,甚至产线上有多少扫描枪,同时在应用层面也可以看到配置项,配置了哪些账号和应用,形成硬件和应用的协同。
在工厂内更多的故障其实来源于工厂设备的故障,例如生产线上扫码打印机故障,其中可能是网络、服务器、数据库等诸多问题产生,通过人为排查效率很低,在CMDB中根据其中的逻辑,延锋可以自动筛选出条码打印机相关的所有事项,快速找到问题的根源。
蔡华东在曾经的业务单元遇到最多的就是生产线卡顿现象,零部件厂商的生产节拍比整车厂要快得多,所以卡顿对于业务开展造成了一定影响。但是整个链条上涉及的系统和流程有很多,这也造成卡顿的原因很难排查。
一个例子是,几年前一个工厂频繁发生卡顿,但这种卡顿又是无规律的,该业务单元成立了专家小组,经过一个半月的排查最终找到是程序开发中的一个问题。蔡华东说,在正常运行情况下是很难找到卡顿的原因,但是卡顿又经常无规律发生,必须在卡顿发生时进行追踪,而在实现自动化运维后30秒就可以发现问题从而快速解决问题。
随着集团IT逐步扩大发展,监控也将成为未来保障延锋IT服务灵活性的重要抓手,因为只有及时找到问题才能保证制造业的生产命脉。而且全方位的监控,还可以进行统一的数据分析,让运维向着智能化的方向发展。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。