至顶网CIO与应用频道 11月14日 人物访谈(文/王聪彬):海尔集团董事局主席、首席执行官张瑞敏曾说过,“没有伟大的企业,只有时代的企业。”不管是伟大的企业还是时代的企业都是运维出来的,所以底层基础架构一定要扎实。“Agile敏捷化,Automation自动化,All-in-One平台一体化”是海尔的3A理念,在一个平台上实现快速的业务交付和数据分析。
全面数字化转型
随着2015年IT部门更名为DTS(数字技术服务),它所肩负的使命就已经发生了翻天覆地的变化,尤其是在目前数字化转型的环境下,基础架构、核心系统、运营、技术创新都是DTS的使命。
在这个过程中海尔集团CTO王养浩遇到的挑战很多,其中最大的就是,我们在支持一个数字化的企业,还是支持一个企业的数字化。可能大家没有感觉出差异,但是王养浩却深知其中的不同。
海尔集团CTO王养浩
因为企业在进行数字化转型时有一个常见的误区,他们会把某个应用或者局部的数字化称为是一个数字化企业。作为以制造业为中心的多元化企业,海尔是一个集制造、金融、物流、电商等复杂业务的有机体,所以海尔的目标是一个全面转型的数字化企业。
在王养浩看来数字化转型并不是技术转型,而是每一个职能部门在业务上进行转型,不断进行产品迭代创新,IT则提供一切所需要的支持,让业务和技术真正产生交互。尤其是现如今云计算、大数据、人工智能等新技术可以很好的帮助每一个职能部门进行转型。
海尔数字化转型布局主要分为上层业务和下层技术,业务部门关注社交和大数据,技术部门通过云计算、人工智能、信息安全等进行支撑。
IT发展三步走
海尔信息化从2000开始,从制造到物流等模块都是根据业务需求搭建系统。到了2007年成立集团IT部,将各职能单元IT整合提供共享服务,成立了像制造业务单元交付团队、电商物流交付团队、人力资源系统交付团队等。2015年相应数字化转型,将一小部分IT放回产业,但还是由集团IT完成最终交付。
王养浩总结了海尔IT的三个阶段,第一、IT平台服务化,实现资源的整合与精细化管理;第二、IT前移,紧密服务于各项业务;第三、IT全球化,从服务、部署、协同、交付等多个层面实现全球化。
首先从盘点整体数字化资产上就包含了非常多的内容,包括软硬件等物理设备、应用、数据等更为抽象的数字资产等等。海尔通过BMC Discovery识别出超过8500个数字化资产(包括硬件、软件、应用程序和数据),绘制了一张清晰的资产蓝图,并借助BMC配置管理数据库(CMDB)解决方案标注了内在关联。
在搭建好CMDB这个基础之后,海尔又部署BMC的IT服务管理平台Remedy,在全球范围内构建了完全基于ITIL标准的、规范化的IT服务平台,服务于全球8万多名员工。与此同时,海尔还在Remedy的底层核心工作流引擎之上,搭建了更多业务场景,HR管理、仓储物流已经搭建完成,并计划继续搭建财务收发款功能。
海尔依托BMC的TrueSight Operations Management 扩展其传统监控体系,为其智能家电业务部门打造了一套综合的端到端物联网监控和安全系统。此外,海尔还借助BMC的应用程序性能监控(AMP)解决方案,跟踪了解所有应用程序的性能。
多源云管理运维新思路
混合云是未来企业的建设方向,海尔已目前已经实现了混合云的架构,私有云支撑了集团各种业务系统,像COSMO;公有云海尔在使用上则相对谨慎,尤其在数据层面。
“海尔在未来几年会布局十多个数据中心提供私有云。”王养浩说,公有云使用了AWS、Microsoft Azure、阿里云,主要在弹性计算和互联网应用的安全防护服务。
越来越多的企业开始部署混合云,这也让运维人员可能会同时在不同的云环境中进行操作,例如,启动公有云实例、将数据从数据中心内的应用迁移到云端等,原有传统的IT运维方式必将面临巨大挑战。
BMC提出多源云战略帮助企业迅速迁移到云端并制定有效的方案安全、高效、经济地管理复杂的混合云环境,应对由多源云复杂性造成的成本和安全性这两大挑战。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。