对于拥有中小型网络的企业,网络治理员通常会使用最常见的办法和经验自行解决网络出现的故障,假如仍然无法解决问题时,就会来电求助专业的服务人员,通常我们的网络维护工程师人员在接到这些求助后,必须选择能够瞬间透视网络的仪器以便迅速的确认和解决网络故障,EtherScope网络通是我们的首选工具。
Cartel是某跨国公司的网络治理员,治理着200多个站点和由多台cisco2950交换机,1台cisco3550交换机和1台cisco2520路由器组成的网络,网络运行的一直很稳定,可是最近有很多人抱怨网络慢的无法忍受,由于一时无法解决,用户变得越来越不耐烦,安恒的网络工程师在接到求助电话后简单了解了对方网络规模和最近网络设备的变动情况后,决定使用EtherScope网络通去现场解决网络故障。
到达现场后,在听取Cartel介绍情况的同时,我们的工程师选择了一个信息接口,将EtherScope网络通接入网络检查网络的基本情况。在监测了一段时间以后,发现这个端口的平均利用率为34.3%,而这其中99%都是广播。在进一步监测发现每秒接收到广播帧的数量都在800以上,且接收到的总帧数也在同数量增长。再察看该交换机其它端口的流量情况发现与上述情况基本相同,其它几台交换机也是如此。在全网中出现这么大的广播流量是否正常?在询问了Cartel之后了解到,用户公司网络内并不存在任何基于广播的应用,很明显是出现了“广播风暴”!
通过仪器的TOP TALK功能,很轻易的找到了网络内有一台机器正在发送大量的广播包,这很可能就是结症所在,我们需要马上找到这台机器并隔离它!虽然我们知道这台机器的MAC地址和IP地址,但是由于用户不能提供具体的网络文档和拓扑图,无法知到这台机器的具体位置。安恒工程师通过网络通提供的独特的追踪交换路由(trace switch route) 功能,快速的查找到这台机器连接到的交换机和具体的端口。有了这些信息,跟随Cartel来到中心机房,拔掉了这台机器连接到的交换机相应端口的跳线,再次将EtherScope网络通接入网络,端口平均利用率显示正常,只有0.1%左右。回过头来去找到那台发送大量广播的机器,开始怀疑是病毒引起的广播风暴,在进行了一次全面的病毒扫描后并没有发现病毒。Cartel告诉我们前一阵子这台机器忽然无法上网,怀疑是网卡坏了,临时更换了一块从旧机器上拆下的网卡,安恒网络工程师根据以往的经验判定,可能是网卡引发的网络故障,由于损坏的网卡一般还能上网,所以这种故障很难发现。在更换了一块可以正常使用的网卡后再次将这台机器接入网络,没有发现广播风暴,故障解除!
不必要的网络流量不仅对于用户来说非常麻烦,假如对难于发现的网络问题作出错误的故障诊断很可能造成更大的混乱。了解造成不必要流量的可能原因及源头是保证网络正常、有效运行不可或缺的一部分。工欲善其事,必先利其器,在查找网络故障的时候应当采取适当的方法、工具和措施来隔离、更正或消除影响网络性能的根源,帮助您避免未来可能出现的问题,但假如不使用正确的工具和故障诊断技巧,这也将是一项非常耗时的工作。将“在哪里、查找什么”的认知与自动化的测试工具(例如福禄克网络公司的ES网络通)结合在一起,您就成为了一名强大的故障解决者。