3、执行重启某台设备的操作
ND:-:reboot-node:id=1,time=0;
Succeed in rebooting Node(0x01).
这个命令是重启的1号终端,其它的终端以此类推,我们可以看一下,重启时的设备状态:
ND:-:show-topology;
Type ID MAC Address Hop State Board Type
CPE 05 00:17:73:60:13:0c 1 Abnormal One Port
CPE 02 00:17:73:60:13:08 1 Normal One Port
CPE 01 00:17:73:60:13:0a 1 Reseting One Port
这里也有一点经验,即重启两台终端设备的间隔时间不能太短,因为终设设备重启的速度很快,如果间隔时间太短的话,很难判断是宽带路由器是位于哪台终端设备后面。
通过以上的方法就可以找到定位到下面带有宽带路由器的终端设备,下面的工作就是到现场去了。要迅速找到那台终端设备的位置要快也容易,那就是原来维护有一个终端设备的MAC地址和具体位置的对应表,如果没有的话,那就麻烦一点了,到现场去一台一台的找,在每台终端设备上都贴着对应的MAC地址,一台一台的找就可以看到了。
在交换机上查找具体哪根网线连接到该宽带路由器上,进行的操作就是纯手工了,还是让机房的同事一直ping着那台宽带路由器的IP地址,我将交换机的网线一根根拨出,如果拨到哪根网线时PING不通宽带路由器了,说明就是使用那根网线的用户家里接了一台宽带路由器,事实上我们的运气很好,才拨第一根网线就找到了,到了该用户家一看,差点没气的背过气去,原来他不是把交换机过来的网线插在宽带路由器的WAN口上,而是接到LAN口了,这样就形成了一台威力强大的DHCP服务器,为整个头端下面所有PC都自动分配IP地址,结果造成大面积的网络故障,那个用户还一脸无辜的样子,“我还没报修呢,你们怎么就上门了?”大哥,你可以害得我们好苦啊。(真想着揣他几脚),出现故障网络拓扑如图2所示:
图2 交换机过来的网线插到了宽带路由器的LAN上
三、故障原因反思及解决方法
针对这一故障现象,我们和工程部的同事研讨了好久,认为这种现象的危害是严重的,因为不论用户是有意还是无意,只要按这个接法做,都会造成大面积的网络故障,而且对于这种实现起来难度系数极小的“破坏”活动,确实是防不胜防。
通过与厂家的沟通,我们制定了三套预防的方案。
(一)让用户使用固定的IP地址
这种方案,实际上就是在我们单位办公室的局域网上网采用的方法,缺点是家庭用户种种条件的限制,很难记住为自己微机分配IP地址,而且如果出现IP地址冲突之类的故障,也很难通过电话等远程的方法指导用户修改IP地址。不过这个方案确实是不怕用户家里自己接一个宽带路由器(而且还是反着接)。
(二)让雷科通的设备只从指定的DHCP服务器获取地址
这个功能是我们非常需要的,在一次次追查那台“捣乱”的宽带路由器未果的时候,我们就在想,如果终端设备上能够设置只通过指定的DHCP服务器获取IP地址的话,这样终端设备就不会被那台宽带路由器所干扰,我们也就不用找得这么辛苦了。但是厂家的技术人员告诉我们,这个想法很好,但是从目前的技术体系来说,是不可能实现(-_-!)。
(三)让用户通过PPPOE的形式上网
这种形式有很多的好处,由于局域网用户上网时不是通过DHCP的方式(当然也不用设置静态IP地址),而是通过PPPOE拨号获得一个IP地址,这样就不会受到非法的DHCP服务器的干扰了。其实PPPOE服务器的好处不仅如此,一来架设一台PPPOE服务器不是一件容易的事,二来通过PPPOE的方式上网,局域网内也不会发生ARP地址欺骗攻击的问题了。有关架设PPPOE服务器的文章,请参看我们以前在IT168上发表文章,链接如下:
利用LINUX6.0桌面版架设PPPoE服务器:http://net.it168.com/a2008/1211/260/000000260035.shtml
架设pppoe服务器拨号上网 防止ARP欺骗:http://subject.it168.com/Article/articleview.aspx?id=212533&type=cms
总之,经过我们不懈的努力,终于把这个故障解决了,真是去了一块心病,不过从中发现我们需要注意的问题还真不少,局域网故障排除就是这样的,会不断的寻到新的问题,但只要用心,总可以找到解决的办法的。