首页 > 人工智能 > 正文

从网络陪诊到独自出诊 企业网络诊断技术

2009-03-02 09:21:10  来源:IT专家网

摘要:因为网络的复杂性,网络故障的诊断、排错也是一个复杂曲折的过程。如何少走弯路尽快排除故障,方法是关键。除此之外,良好的习惯能够杜绝你犯一些低级错误,也是技术水平提高的关
关键词: 网络 企业网络

    因为网络的复杂性,网络故障的诊断、排错也是一个复杂曲折的过程。如何少走弯路尽快排除故障,方法是关键。除此之外,良好的习惯能够杜绝你犯一些低级错误,也是技术水平提高的关键。
    将近八年的技术支持每天与一些奇奇怪怪、匪夷所思的网络故障打交道,这让我越来越觉得自己就像一个外科医生,我的病人就是故障网络。由最初的“陪诊”到独自“出诊”手到病除,在知识经验积累的同时更多的是科学方法的养成。我们的客户一般都有专职的网络维护和管理人员,但遇到一些稍微复杂的网络故障就束手无策求救于客服,我想这也许是很多网管的通病。授人以鱼不如授人以渔,下面和大家分享一下自己的网络诊断术语,希望能够帮助到你。
    1、网络故障的几种可能性
    网络管理员们应该明白:网络故障几乎是不可避免的,我们所能做的就是降低故障发生可能性,在故障发生后能够尽快地排除故障。要做到这些,管理员应对网络的各层比较了解,对自己负责的网络的各个节点的状况要比较熟悉。另外,要知道网络故障发生的几种可能性,在网络排除陷入困境的时候可从中找到突破口。
    下面是我总结的集中可能性:(1)物理层中物理设备相互连接失败或硬件及线路本身的问题;(2)数据链路层的网络设备的接口配置问题;(3)网络层网络协议配置或操作错误;(4)传输层的设备性能或通信拥塞问题;(5)上三层或网络应用程序错误。上面的5个方面适用于大部分网络,当然大家可根据自己网络的情况进行评估顺次列出更多条。这是一个很好的习惯,当然这建立在你的对自己负责的网络非常熟悉的基础上。
    2、网络排错的步骤
    一般步骤:
    某些有经验的网管可以凭借自己的经验、技术及其敏锐的嗅觉快速定位网络故障。但是,对于一般的网络管理人员,掌握网络排错的一般步骤是非常必要的。这个一般的过程是:从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源,排除
    故障,恢复网络正常运行。此外,诊断网络故障的过程应该沿着OSI七层模型从物理层开始向上进行。首先检查物理层,然后检查数据链路层,以此类推,逐步往上,设法确定通信失败的故障点,直到系统通信正常为止。
    具体步骤:
    (1)首先确定故障的具体现象,分析造成这种故障现象的原因类型。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。
    (2)收集需要的用于帮助隔离可能故障原因的信息。从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。
    (3)根据收集到的情况考虑可能的故障原因,排除某些故障原因。例如,根据某些资料(如:设备安装和操作手册)可以排除硬件故障,把注意力放在软件原因上。
    (4)根据最后的可能故障原因,建立一个诊断计划。开始仅用一个最可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑多个故障原因,试图返回故障原始状态就困难多了。
    (5)执行诊断计划,认真做好每一步测试和观察,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到故障现象消失。
    3、网络排错的方法
    掌握正确的排除方法往往可以加快你的排除进程,起到事半功倍的效果。笔者认为,排错方法应该包括排错工具和排错思路两个方面。工欲善其事必先利其器,毫无疑问选择恰当的工具是非常关键的。另外,排除思路也至关重要。正确的思路,能引导你快速排错;错误的思路,会让你南辕北辙甚至铸成大错。
    (1)排错工具
    网络诊断可以使用多种工具:路由器诊断命令、网络管理工具和包括局域网或广域网分析仪(如HCT-6000和HCT-7000)在内的其它故障诊断工具。查看路由表,是开始查找网络故障的好办法。ICMP的ping、trace命令和Cisco的show命令、debug命令是获取故障诊断有用信息的网络工具。如何监视网络在正常条件下的运行细节和出现故障的情况,利用show interface命令可以非常容易地获得待检查的每个接口的信息。show buffer命令提供定期显示缓冲区大小、用途及使用状况;show proc命令和show proc mem命令可用于跟踪处理器和内存的使用情况,可以定期收集这些数据,在故障出现时用于诊断参考。
    我们知道,在网络排错中一些智能的硬件工具能够快速地定位网络故障,是网络排除的好帮手。但笔者要说的是,从某个角度来说解决故障并不是网络排除的唯一目的,作为技术人员通过这次排除中提高自己的技术也是非常重要的。因此,不要过多地依赖这些工具,它们剥夺你这次难得的提高机会。大家尽可能地使用系统工具,并且熟练掌握一两款网络分析软件用软件工具来排错。
    (2)排错方法
    本文中所说的方法并不是具体的方法,我更希望大家能够从OSI的网络七层协议的角度进行网络排除。说实话,这是一条通用的思路和方法,适用任何符合OSI七层模型的网络排错。希望大家能够从宏观的角度出发,从网络底层去认识网络故障。网络故障主要集中在物理层、数据链路层和网络层。下面我就说说如何依次从这三层进行网络故障的排除。
    物理层:物理层的故障主要表现在设备的物理连接方式是否恰当,连接电缆是否正确,Modem、CSU/DSU等设备的配置及操作是否正确。确定路由器端口物理连接是否完好的最佳方法是使用show interface命令,仔细检查每个端口的状态,详细解释屏幕输出信息,查看端口状态、协议建立状态和EIA状态。
    数据链路层:查找和排除数据链路层的故障,需要查看路由器的配置,检查连接端口的共享同一数据链路层的封装情况。每对接口要和与其通信的其它设备有相同的封装。通过查看路由器的配置检查其封装,或者使用show命令查看相应接口的封装情况。如果判断出是租用线路有问题,应该及时向当地电信部门申报。
    网络层:排除网络层故障的基本方法是:沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的IP地址。如果路由没有在路由表巾出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由。然后手工配置一些丢失的路由,或者排除一些动态路由选择过程的故障,包括RIP或者IGRP路由协议出现的故障。例如,对于IGRP路由,选择信息只在同一自治系统号(As)的系统之间交换数据,查看路由器配置的自治系统号的匹配情况。
    因为网络的复杂性,网络故障的诊断、排错也是一个复杂曲折的过程。如何少走弯路尽快排除故障,方法是关键。除此之外,良好的习惯能够杜绝你犯一些低级错误,也是技术水平提高的关键。以我的经验,良好的习惯保护备份、记录、总结。有备无患,操作前做好必要的备份就能够避免次生故障的发生(故障扩大,将病马医死)。记录不仅包括在故障处理过程中的操作,还包括故障排除后对这次排除经历的记录。记录既有加深印象的作用,也利于以后的借鉴。总结才能提高,可以将经验升华为技术,建议大家写排错日志和总结笔记类似的东西。还是那句话,我的网络诊断术对你有帮助。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。