扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:CIO时代网 2009年2月24日
关键字: IT运维
概述
最近给客户做咨询时,跟行业客户谈起关于IT运维管理在各行业的运用,关于IT运维管理方面有一些总结,跟大家分享一下。先讲一个大家都有可能经历过的故事,一位叫David的客户说他所在的公司承接了一个房产交易公司的网络运维服务。顺便介绍一下David,名校计算机专业毕业,是大家公认的技术专家,手下十来号人,技术底子也不差。项目运作初期,感觉很良好,蛮轻松自在的,而用户对David团队的服务也比较满意。但是,最近一段时间经常出现故障,用户网络连不上房产交易系统,导致用户向David的上司进行了投诉。David亲自现场,把所有故障征兆都详细分析了一遍,也搜出了几个故障点,情况虽然有改善,但还是没有把故障根本排除。整个团队都加班加点地在现场进行故障分析,David觉得很郁闷。
听了David的诉苦之后,其他几位客户也感同身受。纷纷说起了自己的不幸,经常碰到莫名其妙的故障,加班加点排除故障,忙忙碌碌,像无头苍蝇一般不停地出现在解决问题的现场…
听到这些,我深表同情,他们都是在IT运维管理过程中深受其害的人。说起IT运维管理,大家都有所了解,但是要真正理解IT运维管理过程中的一些有效解决故障的方法,客户的感觉是没有很好的工具,只能在自己的负责区域里面用一些小聪明去解决一次两次的问题,所谓的“投机取巧”。
其实,在IT运维管理过程中,主要的故障征兆表象就是一句话“网络不通,服务连接不上”,但造成这个表象的原因却有很多,整个网络运维可以出现故障点的地方应该说数不胜数。单纯依赖IT运维管理人员人工地去监测、排除故障,效率实在有点低。鉴于这些故障的原因,大体总结几点,主要包括:网络拓扑不清晰、故障定位难、异常流量监控困难、没有行之有效的体制约束使用人员。
强大的搜索利器
在此,我总结了在IT运维管理过程中可以的借用的利器,帮助我们IT运维管理人员走出困境。
利器之一,网络拓扑图。在日常的IT运维工作中,运维管理人员对网络的监控只是单点地针对设备进行观察以及排错,无法对网络整体进行有效的认识或监控,好一些的可以在自行画制的静态拓扑图上简单描绘着网络的连接状态。但仅有静态的拓扑图,对于日常IT运维还是远远不够的。我们所需要的是一张能够实在现实网络中所有设备工作状态、线路流量状态并可以智能进行告警通知的拓扑图。
利器之二,IP-Mac表。当网络出现故障时,管理人员为了查找一个故障源IP需要先查找多台路由器的arp表和交换机的mac表,最后定位到故障源IP所在端口位置。这个过程花费我们管理人员较长的时间,如果出现多个故障源时,情况会更加地恶劣。如果我们把整个网络中所有IP地址、MAC地址、交换机端口的对应关系实时地整理成一个表格,当网络中出现故障,需要查找故障源时,便可以快速浏览这个表格以进行故障定位。我们称这个表格为IP-Mac表。
利器之三,行之有效的管理体制。有了以上两种必选利器后,管理人员可快速地对故障进行排查,也可以对造成故障的源头进行跟踪,但是,现有的状况往往是这样:“当IT运维人员发现故障源机器,是由于使用者不当地对网络进行使用,在互联网上任意下载文件耗损网络带宽、下载文件中有病毒导致病毒爆发、任意拔插网线导致网络阻断等等”。但又苦于IT运维部门是一个对内服务的部门,没有相应的规章制度对使用人员进行约束。因此只能对使用人员说明故障原因,希望不要再犯。但是不久,又有另外一个人犯同样的问题,又导致同样严重的网络故障。
摩卡业务服务管理(Mocha BSM)的网络拓扑管理
摩卡业务服务管理(Mocha BSM)提供多种网络拓扑图——二层物理拓扑、三层逻辑拓扑、自定义拓扑、管理拓扑等,其中二层物理拓扑真实呈现网络设备状态,通过物理拓扑图的展示,管理人员可以及时地知道网络设备的工作状态,网络的压力点所在,并且可以对网络中的所有设备进行快速的浏览以及配置。另外还为用户提供了强大搜索功能,可想而知当网络庞大时想要快速找到故障点或者是管理员想要的信息是多么的麻烦,耗费的时间也是较长,不利于快速解决问题,通过Mocha BSM的强大的搜索功能,可以迅速的将故障点展现出来,并且能够特别直观的在多种拓扑图上将搜索的内容定位,可有效提高工作效率。
“为了改善这种对管理员不利的状况,需要企业管理人员对现有的IT运维工作进行高度的重视,制定一套行之有效的网络使用规章制度,并且严格进行落实。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者