Keywords: Catalyst 8540 8510 Multicast IOS No ip mroute-cache CiscoWorks
有一个问题,象一个影子般的跟着我,好久了...呵呵,有够夸张啦。
是这样的,一个ATM主干企业网络里有两台Catalyst 8540, 四台8510,拓扑图如下(出自一位参与解决问题的CCIE之手):
这个网络里有多个基于多播技术的视频监控流, 源主机分别连接在11.3,11.5和11.6之上,用户还需要使用同样基于多播技术的桌面视频会议系统提供点对点或点对多点的可视会话。
问题是只有连接到11.6上的的一个的监控流能正确地传到11.1以及相邻的11.2、11.7上,传不到11.3和11.5上。使用桌面视频系统的时候更惨,8540交换机的ARM端口干脆当掉了。在多播流的传送过程中,可以观察到明显的传输中断。
这时候的配置为点对多点的ARM子接口+ atm map-list、每台8540到直接连接的交换机建一个VC(试过LANE,但是8510经常当机), 遍试各种PIM模式、RP配置方法无效。后来参考一此资料得知,在ATM网络上路由多播,Cisco有多种高级的方式,比如pim nbma-mode、atm及pim multipoint-signalling等,但85xx一概不支持,于是开始有了要将网络调整为Full-Mesh VC的想法。但是我认为,即使是Full-mesh VC也解决不了传输中断和导致当机的问题。
正好,新的IOS发布了,升级之后当机的问题解决了,中断的问题向Cisoc中国TAC开了一个P3 (优先级=3)的Case,另一位CCIE将网络情况描述如下:
分析资料后,决定先将网络调整到Full-mesh VC方式, 即VC的数量=交换机台数n*(n-1)/2 ), 下图为以某台交换机上的VC视图:
经此调整之后,多播流可以传输到所有的交换机上,但中断问题仍然存在,一位CCIE认为Cisco 有很多版本的IOS都有ip mroute cache工作不正常的问题,应禁止掉。关闭ip mroute-cache之后11.6之上的监控图像传输正常,但其它的多播应用均有接收三分钟后中断的现象,而且可想而知地,CPU利用率非常高,没有主机在接收多播流的情况之下连接多播源主机的交换机CPU利用率在40以上,有接收者时高达99%。
只好又到Cisco TAC开了一个P1的Case, 工程师分析后认为是IOS的BUG,需由开发工程师(DE)修改IOS,于是一周之后,DE拿出了两个IOS的XP版:)... show version 如下:
Cisco Internetwork Operating System Software IOS (tm) PNNI Software (cat8540m-WP-M), Experimental Version 12.1(20020121:054758) [ramr-portstuck 114]
...
Cisco Internetwork Operating System Software IOS (tm) Cat8510MSR WA5-5 Software (Cat8510M-WP-M), Experimental Version 12.0(20020118:092001) [ramr-arm_porstuck 112]
...
将IOS升级之后,调整配置,终于获得了令人满意的效果。最终配置为:
interface ATM1/0/0.121 multipoint
description links to 8540_B
ip address 10.10.11.149 255.255.255.252
ip pim sparse-mode
ip ospf network point-to-point
map-group map121
atm pvc 2 121 pd on
encap aal5snap interface
ATM0/0/0 0 121
!
interface ATM1/0/0.131 multipoint
description links to 8510_1
ip address 10.10.11.141 255.255.255.252
ip pim sparse-mode
ip ospf network point-to-point
map-group map131
atm pvc 2 131 pd on
encap aal5snap interface
ATM0/0/0 0 131
!
...
map-list map121
ip 10.10.11.150 atm-vc 121 broadcast
!
map-list map131
ip 10.10.11.142 atm-vc 131 broadcast
!
...
几点心得是:1.使用auto-rp。 如果用ip pim address ...会有一个警告信息PIM-6-INVALID_RP_JOIN;
2.不要使用桥接(bridge-group),影响性能;
3.以太网交换机比ATM交换机更适合作为企业网的主干设备。
最近其它的心得:
1. show version 输出注意看System restarted by ... 有时候可以看到硬件问题导致重启的记录,比如内存校检错。异常原因当机时可能会在flash中生成crashinfo_20020101184611之类的信息文件,可以用more命令或TFTP down 下来后用记事本查看,其中有当机前的操作记录,当机时系统状态等信息。
2.《Native Vlan 与 IVR 》中提到的msfc不配所有VLAN不能通过其它VLAN端口连通的问题据一位CCIE说在ISP版本IOS中没有。
3. Log信息是最有价值的排错参考资料之一,不妨记得常常打show log看一看,有条件的话配置一个syslog server.
4. 注意CiscoWorks的日志不会自动清除,磁盘空间不足时可以运行脚本备份后删除。典型安装时为:
c:
cd "\Program Files\CSCOpx\bin\"perl ..\cgi-bin\admin\logbackup.pl -force -dir d:\backup_dir