科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网CIO与应用频道中国移动网络运维管理的探索与实践

中国移动网络运维管理的探索与实践

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

最初中国移动的网管支撑系统按照三级运维管理模式建立,即总部级、省级和地市级。2000年底到2001年,中国移动大多数省份基本完成了这一融合,在人力资源平台的建设上具备了向全省集中化维护迈进的条件。

作者:陆茵 戴忠 2008年1月25日

关键字: 运维管理 中国移动

  • 评论
  • 分享微博
  • 分享邮件

  1 中国移动网络运维体系的发展

  1.1发展历程

  我国移动通信网的建设始于1987年,为模拟TACS网。1994年,当时的邮电部决定大规模引进GSM网,由此引发了我国移动通信市场的快速发展。截至1999年,中国移动已经基本形成了以省际汇接网(一级汇接局)、省内汇接网(独立的二级汇接局,或由一级汇接局承担)、移动本地网(移动端局交换机)的三层网络结构,如图1所示。

  2000年以前,邮电部移动局是电信总局的下属单位,各省移动局是各省电信管理局的一个专业局。那时网管系统及运维体系尚处于建设时期,所有的设备维护管理及操作均由设备所在地的现场维护工作人员承担。

  2000年,随着移动分营,正式组建中国移动通信集团。此时我国的移动通信业务发展进入快车道,网络规模几乎每年都在成倍增长,设备数量和网络的复杂性剧增,使得网络运维的工作量也在相应增长,此时企业已面临运维人员数量和技能不足的严峻压力。为了解决这一问题,中国移动着手思考和探索如何通过改革运维管理体系和建设运维支撑手段来缓解业务发展和人力资源的矛盾。

  最初中国移动的网管支撑系统按照三级运维管理模式建立,即总部级、省级和地市级。省级侧重于性能分析,地市级则承担故障管理、配置管理和资源管理等绝大多数的维护工作,但是运维体系的属地化特征比较明显。这一发展思路仍无法解决前述业务发展带来的运维工作量压力。

  2001年,中国移动提出了网络运维集中化思路,尝试推行以省为中心的网络运维集中化管理,将分散在地市级的核心网设备进行集中监控和集中维护,同时对承担省际汇接业务的设备进行以总部为中心的集中维护模式,这在国内运营商中尚属首例。这种集中化运维方式的意义在于:一是减少了大量值守型维护工作对运维人员数量的需求;二是省维护中心的人员可以得到更多的锻炼和提升技能的机会;三是将技术专家从值守型工作中解放出来,充实到预防性维护和网络优化岗位,从清除设备隐患、减少故障发生、提升网络质量等方面提高网络运维效率。

  

  

  

  图1 中国移动网络早期的结构

  1.2运维集中化采取的措施

  为了保证网络运维集中化的稳步实施,中国移动采取了三步走的方式。

  (1)整合省公司技术人才资源,构建集中化运维的人力资源平台

  2000年之前,省公司网管中心的定位决定了此时尚不具备实行全省集中维护模式的条件,主要表现在两个方面:一是人员;二是手段。从数量和技能方面,省公司网管中心的人员不足以承担全省所有本地网的核心网集中维护工作;同时,网管支撑平台此时也不具备告警管理等集中维护必备的能力。为此,中国移动集团提出:首先试行省公司、省会公司的网络运维部门的融合,将通常聚集在省会公司的大量技术人才充实到省公司网管中心,为全省网络设备的维护工作发挥作用。

  2000年底到2001年,中国移动大多数省份基本完成了这一融合,在人力资源平台的建设上具备了向全省集中化维护迈进的条件。

  (2)按照两级集中管理、三级维护作业的生产组织模式搭建网管IT支撑平台

  中国移动确立了网络运维集中化改革思路后,在整合省公司、省会公司技术人才资源的同时,网管支撑平台的建设思路也相应地从三级网管调整为两级集中管理、三级维护操作,并将原有的地市级网管平台改为地市级操作维护系统。

  在IT支撑手段建设过程中,中国移动从局数据配置入手,循序渐进地开始了以省级网管中心为核心的集中维护演进过程。

  以局数据制作和修改为例:在原有的传统运维模式中,一直是由各个机房独立操作来完成,全网的同一组局数据的制作往往是由地市级的数百名操作维护人员分别完成的,其中难免出现人为差错,由此引起的后续投诉、故障处理是进一步加剧运维工作负担的因素。2001年,当网管支撑平台开发建立了局数据集中制作功能,并随后在省级网管中心完成局数据统一制作后,这一问题迎刃而解,成为运维集中化改革的良好开端。

  (3)科学部署,大力实施新型的集中化运维管理方式

  全网局数据的集中制作确实解决了局数据的完备性和准确性问题,也减少了部分重复操作的工作量,但是各地交换机的大量增加仍会带来越来越大的运维人员的数量缺口。一般情况下,每个新建交换局址需要至少4名轮班值守人员完成例行生产作业和一名日间维护人员进行故障处理和故障投诉等。按照传统的运维模式,网络规模的增长要求维护人员的数量几乎是同样地线性增长,而这种局面显然是企业难以承担的。

  从国外电信运维的经验来看,在发达国家,由于人力资源的成本很高,多数企业从开始就会考虑如何以自动化和信息化手段减少人员数量,降低运营成本。在国外的网络运维中,大量采用了机房无人值守的方式。无人值守并不是仅仅凭借转变观念就可以实现,而是需要一系列的支撑手段和配套的管理制度才能真正实现。

  在中国移动推行撤并地市级值守型维护人员的工作中,首先部署动力环境监控系统,保证地市所有核心网设备机房的配套设备、门禁等纳入集中监控;随后采用逐步转移维护任务的方式,从GSM网核心设备入手,以地市作为第一维护责任“人”向省级网管中心承担第一维护责任“人”的角色转变,各省移动公司根据支撑手段的到位情况和人员情况部署实现计划。大约用了两年的时间,中国移动基本实现了大多数省的交换机以上设备的集中维护。

  在此基础上,中国移动又继续深化集中维护改革,将GSM网的BSC节点、数据网、传输网等骨干设备逐渐纳入集中化运维管理的范围。在完成这一阶段的运维集中化改革之后,对地市层面的各专业机房的值守型维护技术人员基本进行了撤并,每个地市只保留动力环境的综合监控人员值班。

  至此,中国移动经过约4年的时间,基本将原有的、分散的属地化运维模式,建设成为新型的、以省级维护单位为中心的、跨地域的集中化维护模式,减少了重复操作、重复部署带来的资源浪费,大大缓解了业务高速发展与运维管理人员数量不足的矛盾。

  2 应对挑战,打造卓越的网络运维体系

  我国电信行业的成长背景与大多数国外电信运营商有所不同,我国的电信运营商不是在市场竞争环境下发展起来的,因此早期的运营商没有明确、突出的竞争目标和策略。随着电信体制的改革,市场竞争机制的建立,各个运营商竞相开始建立自己的竞争优势,其中中国移动将优异的网络质量作为竞争的重点之一。

  2.1建立面向市场和客户服务的网络运维体系

  我国电信事业的蓬勃发展已经历了10多年,经过多年的市场竞争,各大运营商在电信运营方面积累了丰富的经验,尤其在网络管理和质量优化方面,但是运营商之间的业务同质化越来越成为一种可能,仅从网络质量上保持竞争优势已越来越难。未来的网络竞争能力将不仅仅体现在网络质量上,更体现在运维体系对市场、服务的全面支撑能力上。从国外电信运营的经验来看,集中化、快速反应和外包已经是网络运维体系发展的三个重要趋势。我国的电信企业应从中找到适合自身特点的发展方向。

  中国移动在实现了广泛的运维集中化之后,将下一步的发展目标定位在向市场、服务部门提供高效的支撑,即建立面向市场和客户、能够快速响应的高效运维体系。而该体系的成功实施需要一整套管理制度和执行规则来保证,并且要有良好的手段和工具支撑。通过深入的研究和分析,中国移动提出了卓越网络运维体系的建设,并将其具体落实到以下方面:

  (1)明确目标定位和策略,以有力支撑企业的战略实现;

  (2)简洁高效的运维管理模式和组织结构;

  (3)以客户需要为导向,系统化、标准化的运维流程体系;

  (4)高效统一、技能优秀的运维队伍;

  (5)领先、实用的运维IT支撑系统。

  如何将这一目标分解和落实为具体行动呢?在这方面,eTOM(EnhancedTelecommunicationsOperation Map)为我们提供了很好的参考。eTOM level1的结构如图2所示。

  

  

  

  图2 eTOM level1结构示意

  eTOM是TMF组织制定的、被业界广泛采纳的业务流程框架。eTOM描述了电信企业所需要的流程,并根据业务的重要性和优先级提供这些流程不同层次的分解。

  eTOM将客户作为目标对象,逐级分解满足客户需求的业务活动和资源。参照eTOM对运维管理体系进行优化,可以帮助我们系统化、结构化地建立面向客户、面向业务的运维流程体系,从中可以发现我们存在的流程缺失、流程孤立等问题。通过补充和完善流程体系,可以促进网络运维与业务部门、服务部门的协作与沟通,从流程上保障对市场、对客户服务的有力支撑。

  2.2打造中国移动高效统一、协同发展的网络运维体系

  我国地域辽阔,经济发展水平差异较大。在以往的发展中,各省移动公司依靠自身的实践经验、管理能力来思考和探索各自的运维体系发展,致使省公司之间的差异较大。如果继续发展下去,将会把差异继续积累、放大,势必对中国移动的整体运维能力带来不利影响。这一问题在我国的其他电信运营商中同样存在。中国移动尝试通过统一部署标准化运维流程体系来改变这种状况,这种标准化的流程体系建设是结合了eTOM和ITIL模型设计的。

  eTOM是逐级细化的,从1级的电信运营主要核心业务流程到2级的功能流程、3级流程活动层及4级的任务流程,可用来建立系统化、层次化的完整流程体系,还可为我们很好地解决流程的完备性、标准化问题。流程体系是运维体系的核心部分,是岗位、组织梳理的基础,借助IT手段固化流程后,将可以提升运维体系的效率。

  建立流程体系是企业开展标准化运作的基础。通过标准化可以克服网络运维工作中的随意性带来的效率不高、质量不稳定等问题,是从经验管理到知识管理的跨越。中国移动将以这种先进和科学的流程体系作为固化的生产和管理操作规则,以此帮助部分地区由于人员能力和经验不足带来的运维管理水平的落后,使得全网运维体系协同发展、共同进步。

  2.3探索和实践能够带动价值链发展的网络运维体系

  电信运营商不仅为社会公众提供了各项基本电信业务,也为价值链上的各企业提供了业务发展平台,如SP、CP等。在网络运维领域,电信设备制造商为网络设备提供售后技术支持服务,设备代维公司为网络主设备、配套设备提供代维服务等。过去我们过多地依赖电信设备制造商的技术支持,而对代维公司的管理又比较松散,使得三者的关系处于比较混乱的局面。为了解决这些问题带来的职责界限不清,中国移动已经建立了统一标准的售后技术服务管理机制,并明确了网络设备售后技术支持服务的界面和服务标准,使得设备供应商可以集中资源,提供规范化、标准化的服务,由此提高了效率、降低了成本,而运营商也从中受益。

  与设备供应商的关系有所不同,中国移动与代维公司的合作将更加深入,代维公司承担了部分网络设备的具体维护任务,其维护效率和质量直接决定了中国移动的网络表现。提高代维公司的管理和维护技能、改进支撑手段等将有助于提升中国移动全网运维表现的提升。中国移动正在建立对网络设备代维公司的整体SLA管理要求,一方面借此来促进代维公司加强自身的技术能力,另一方面将开展提升代维公司维护技能的相关活动,不让网络运维的任一环节出现“掉队”现象。通过对设备供应商、代维公司的规范化管理,带动了三者的良性发展。

  3 结束语

  在运营管理方面,我国电信行业距离国际一流企业还有一些差距,需要大家共同努力,加强探索和实践,在彼此的竞争中锻炼和提高综合网络管理能力,为我国电信运营业提升整体实力、走向世界作出贡献。

  中国移动的卓越网络运维体系的建设并不是阶段性的项目工作,而是一项需要长期开展的日常工作,需要不断发现和改进运维体系中存在的问题,才能真正形成和保持领先优势。中国移动将继续在网络运维体系的发展和创新上不断努力,努力探索出一条符合行业发展趋势、适合我国特色的网络运维发展卓越之路。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章