介绍
本文主要说明在混合模式(Supervisor Engine上运行CatOS,而多层交换机特性卡(MSFC)上则运行Cisco IOS)下运行的Catalyst 6000 / 6500系列交换机故障排除方面的常见问题。本文不讨论运行本地IOS的Catalyst 6000系列交换机的故障排除问题。文档的目的在于帮助Cisco客户识别和修复一些常见问题,并在联系Cisco技术援助中心(TAC)之前执行更全面的故障诊断和排除工作。采用有条不紊的收集信息、诊断和故障排除流程,可以确保解决问题所需的信息不会丢失。缩小问题的范围能够节约寻找解决方案的宝贵时间。
要进一步了解有关MSFC或MSFC 2故障排除方面的信息,请参考Csico.com上的下述文档:
重要提示
建议您在开始阅读本文档之前仔细阅读Catalyst 5000产品的现场注重事项,以了解软件和硬件方面的相关问题。参见现场提示的下述清单:
本文讨论Catalyst 6000 / 6500 系列交换机的“show”命令、问题症状以及故障诊断和排除流程。您应该了解基本的结构信息和Catalyst 6000 / 6500系列交换机的基本知识。参见下述文档:
所使用组件本
文不限于特定的软件和硬件版本。
本文档中所使用的信息都基于特定实验室环境中的设备。文档中所用到的所有设备最初都使用原始(缺省)配置。假如您在正在运行的网络中进行操作,请确保您在使用任何命令之前都了解其潜在影响。
诊断命令
显示版本
显示模块
显示端口
显示测试
显示日志
显示日志缓冲器
显示配置
显示 mac
显示计数器
显示系统
显示环境
显示错误检测
显示启动
dir (交换机)
dir (ROMmon)
?/TD>
Refer to the 请参阅“Catalyst 6000命令参考指南”了解有关“show”命令的更多信息。
端口/连接问题
Catalyst 交换机与NIC卡的兼容性问题
假如您的交换机端口采用网络接口卡(NIC)连接到工作站/服务器,并且假如您发现诸如工作站/服务器运行减慢、间歇性的连接问题等网络症状,或者是同物理连接和数据链路错误相关的Catalyst交换机问题,请参阅下面的文档。本文档提供有关交换机端口和NIC卡之间的常见物理和数据链路层之间的故障排除信息,以及一些厂商的已知NIC问题及其解决方法方面信息。
用“show port”命令在errDisable State状态下显示端口
出于很多原因,端口可能出现errDisable.一些错误条件列举如下。
当端口因故障而被禁用(errDisabled)时,它可以有效地关闭并且在那个端口上不发送或接收任何业务。端口LED被设置为橙色,假如您发出“show port”命令,则端口状态将显示为“errDisabled”。下面的例子说明了从交换机的命令行界面(CLI)所看到的“errDisabled”端口的状态:
Console> (enable) show port 11/1
Port Name Status Vlan Level Duplex Speed Type
----- ------------------ ---------- ---------- ------ ------ ----- ------------
11/1 errDisable 1 normal auto auto 10/100BaseTX
---- 输出抑制 ----
为了从“errDisabled”状态恢复,您必须发出命令“set port disable ”和“set port enable ”来先禁用再重新启用该端口。
“在CatOS平台上从errDisable 端口状态恢复”一节说明了导致端口进入errDisable状态的原因,并提供了避免出现这种状态的进一步故障排除步骤。
工作站在启动期间不能登录入网络/不能获得DHCP地址
当客户机处于加电运行或者重启的时候,您可能会发现下面症状中的一种。问题可能是由于交换机所导致的初始连接延迟。
交换机对不同的特性(如生成树协议(STP)、EtherChannel协商、中继协商或者链路速率/双工协商等)执行状态校验。交换机将端口置于“forwarding”模式将需要30-34秒的时间,而工作站可能无法登录或者无法通过DHCP获取IP地址。“使用Portfast和其它命令来修复工作站启动连接延迟”解释了如何缩短最初的连接延迟以及如何解决上面所提到的问题。
1000BASE-T GBIC 无法识别或者工作
假如您有一个1000 BASE-T千兆位接口转换器(GBIC),但它没有被识别或者不能正常运行,请参阅下述文档来校验该软件是否支持GBIC:
假如您运行的软件版本没有问题,但是链路仍然无法工作,请参阅专门针对电缆规范的下述文档:
交换机端口故障排除
网络端口无法工作或者只能部分工作的症状非常多,不过通常可以归为两大类:丢失网络连接(不能连接到服务器,无法ping通,等等)以及性能变慢(比正常状态慢、网络不能以最快速度运行,等等)。这些症状可能是物理层问题、错误配置、业务过载等问题导致。下面的文档解释了进一步缩小问题原因范围所需的不同交换机端口问题以及故障诊断和排除步骤:
Supervisor I上的IP MLS故障诊断和排除
假如您碰到不同VLAN内工作站间的连接问题,可能需要在基于Catalyst Supervisor I的系统上诊断和排除多层交换(MLS)特性的问题,以确保在硬件转发列表中包含正确的条目可用。参见下述文档:
假如在根据本文进行故障诊断和排除后仍然无法解决问题,则可以联系TAC获得进一步支持。
Supervisor II上单点发送IP路由选择Cisco快速转发的故障诊断和排除
假如您碰到不同VLAN内工作站之间的连接问题,可能需要在基于Catalyst Supervisor II的系统上诊断和排除Cisco快速转发特性的问题,以确保在硬件转发列表中包含正确的条目可用。参见下述文档:
假如在根据本文进行故障诊断和排除仍然无法解决问题,则可以联系TAC获得进一步支持。
红/橙SYSTEM和STATUS LED的LED故障诊断和排除
这一节说明在Catalyst 6000 Supervisor引擎上的SYSTEM和STATUS LED显示红色或橙色的时候,如何进行故障诊断和排除。采用这些信息,您将了解导致“非绿”LED状态的条件,以及您可以用来校验和解决每一种状况的“show”命令。
LED
颜色
可能的原因
STATUS
红色
诊断测试失败
出现温度过高的状况
STATUS
橙色
切换到 ROMmon
SYSTEM
红色
电压故障
同时出现温度和风扇故障
100 % 的电源故障(在双电源情况下两个电源均出现故障,单电源下这个电源出现故障)
EEPROM 故障
SCM 通信失败
冗余时钟故障
SYSTEM
橙色
温度告警
风扇故障或者部分电源故障(两个电源中的一个出现故障)
STATUS LED - 红色
当检测到下述条件中的一种时,Supervisor引擎上的STATUS LED将显示为红色:
条件1-诊断测试失败
STATUS LED闪烁为橙色一次之后在诊断性启动测试期间一直保持橙色。当模块运行(在线)的时候变为绿色。该模块没有正常运行,因为在加电或者重启诊断测试期间检测到了故障。发出“show test”命令来查看诊断测试的结果。下面这个例子说明了插槽2中Supervisor引擎中的错误显示。
Console> show test 2
Module 2 : 2-port 1000BaseX Supervisor
Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown)
ROM: . Flash-EEPROM: . Ser-EEPROM: . NVRAM: F EOBC Comm: .
Line Card Status for Module 2 : PASS
Port Status :
Ports 1 2
-----------
. .
Line Card Diag Status for Module 2 (. = Pass, F = Fail, N = N/A)
Module 2
Cafe II Status :
NewLearnTest: .
IndexLearnTest: .
DontForwardTest: .
DontLearnTest: .
ConditionalLearnTest: .
BadBpduTest: .
TrapTest: .
Loopback Status [Reported by Module 2] :
Ports 1 2
-----------
. .
Channel Status :
Ports 1 2
-----------
. .
Console>
“show test”命令的输出报告NVRAM故障(NVRAM:F)。请参见“由于NVRAM失败而导致Supervisor故障,或者Show version命令显示Checksum故障”以了解诊断排除NVRAM故障的更详尽信息。假如其它组件或者测试也失败,则联系TAC进行进一步故障诊断和排除。
条件2-出现温度过高状态
当环境监控检测到温度过高状态的时候,它就会报告下述日志信息中的一种,并且,在启用的情况下,会显示简单网络治理协议(SNMP)重大告警。这些系统日志信息都同温度相关:
要了解更多信息及推荐的相应措施,请参见Catalyst 6000文档中的“消息和恢复流程”部分。
SYSTEM LED - 红色
通常,SYSTEM LED变为绿色表示所有机柜的环境监控都处于OK状态。假如一个或者多个环境监控器报告故障,则SYSTEM LED就变为橙色或者红色。“ChassisMajorAlarm”就会变为“on”状态,对应于下述条件中的一种:
条件1-电压故障
WS-C6K-VTT=电压终端(VTT)模块将在Catalyst交换总线上终接信号(请参见“Catalyst 6000系列VTT模块和时钟模块安装注重事项”以了解更多信息)。假如没有安装冗余Supervisor引擎,并且VTT模块处于稍微或者严重温度过高状态,则系统就会关机。在背板上有三个电压调节器(VTT)。假如一个VTT模块出现故障,则就会出现稍微告警。假如两个出现故障,则就会出现重大告警,正确措施就是关闭系统。
发出“show test”或者“show environment”命令来显示VTT的状态,如下所示。
Console> show test
Environmental Status (. = Pass, F = Fail, U = Unknown, N = Not Present)
PS1:. PS2:N PS1 Fan:. PS2 Fan:N
Chassis-Ser-EEPROM:. Fan:.
Clock(A/B):A Clock A:. Clock B:.
VTT1:. VTT2:F VTT3:.
下面的例子说明时钟模块A和VTT模块2发生故障。
Console> show environment
Environmental Status (. = Pass, F = Fail, U = Unknown, N = Not Present)
PS1:. PS2:N PS1 Fan:. PS2 Fan:N
Chassis-Ser-EEPROM:. Fan:.
Clock(A/B):B Clock A:F Clock B:.
VTT1:. VTT2:F VTT3:.
条件2-温度和风扇同时发生故障
发出“show system”命令来确认是否有有效温度告警产生,风扇是否出现故障。由于风扇出现故障,也就可能引发温度告警。在下面的输出中,“Temp-Alarm”和“Fan-Status”字段都是黑体。
Console (enable) show system
PS1-Status PS2-Status
---------- ----------
ok none
Fan-Status Temp-Alarm Sys-Status Uptime d,h:m:s Logout
---------- ---------- ---------- -------------- ---------
ok off ok 14,08:03:03 20 min
PS1-Type PS2-Type
------------ ------------
WS-CAC-1300W none
条件3 - 100%的电源故障(在双电源情况下两个电源均出现故障,单电源下这个电源出现故障)
发出“show system”命令来确定您是否碰到了100%的电源故障。在下面的输出范例中,“PS1-Status”和“PS2-Status”字段都是黑体。在此输出中的系统只有一个电源,状态显示为“faulty”。电源可能需要更换。联系TAC以获得进一步的帮助。
cat6k> (enable) show system
PS1-Status PS2-Status
---------- ----------
faulty none
Fan-Status Temp-Alarm Sys-Status Uptime d,h:m:s Logout
---------- ---------- ---------- -------------- ---------
ok off faulty 409,16:15:08 20 min
PS1-Type PS2-Type
-------------------- --------------------
WS-CAC-1300W WS-CAC-1300W
Modem Baud Traffic Peak Peak-Time
------- ----- ------- ---- -------------------------
disable 9600 0% 10% Fri Nov 22 2002, 15:24:46
条件4-EEPROM故障
发出“show test 1”命令来浏览闪存EEPROM和串行号EEPROM上的诊断测试状态。假如Supervisor不能够读取某个模块中的EEPROM,则该模块就被标记为“faulty(F)”,并且将不再出现。可能的情况是该模块没有正确固定。重新固定该模块来看问题是否能够解决。假如不能解决问题,则重新加电启动交换机。假如上述流程还不能够解决问题,则该模块可能需要更换。联系TAC获得进一步支持。
下面的例子显示插槽1中Supervisor上的“Ser-EEPROM”出现故障。
Console (enable) show test 1
Diagnostic mode: minimal (mode at next reset: minimal)
Module 1 : 2-port 1000BaseX Supervisor
Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown)
ROM: . Flash-EEPROM: . Ser-EEPROM: F NVRAM: . EOBC Comm: .
条件5-SCP通信故障
SCP定义了用来在Supervisor CPU和MSFC以及其他线路卡之间通过Catalyst6500上的以太网带外信道(EOBC)进行信息交换所使用的协议。
假如这种通信过程中出现故障,您可能会在控制台或者系统日志中看到以下错误信息。下表提供了相关信息及推荐措施的简要描述。
消息
解释
推荐的措施
SYS-2-MOD_NOSCPRESPONSE: Module [dec] not responding over SCP
模块不能对带外通信信道上的Supervisor引擎请求作出响应。这种错误在带外信道非常繁忙的情况下可能发生。[dec]是没有响应的模块数目。
假如问题仍然存在,将“show log”、“show tech-support”以及“show logging buffer -1023”命令的输出传给TAC以求获得进一步支持。
SYS-2-MOD_SCPERROR2: Module [dec] local SCP error detected... resetting
这个消息说明用于同系统中其它模块进行带外通信的Supervisor 引擎串行信道存在故障。[dec]是出现故障的Supervisor引擎的数目。
系统尝试通过复位出现故障的Supervisor引擎来实现恢复。假如问题仍然存在,将“show log”、“show tech-support”以及“show logging buffer -1023”命令的输出传给TAC以求获得进一步支持。
条件6-冗余时钟故障
“Catalyst 6000系列 VTT模块和时钟模块安装注重事项”可以提供关于时钟模块(WS-C6K-CLK=)的更多信息。
在运行Catalyst软件的系统上,发出“show environment”命令。下面的例子说明了如何校验运行Catalyst软件的Catalyst 6000系列交换机上的VTT模块和时钟模块的状态。它显示时钟A出现故障,需要更换。
Console> show environment
Environmental Status (. = Pass, F = Fail, U = Unknown, N = Not Present)
PS1:. PS2:N PS1 Fan:. PS2 Fan:N
Chassis-Ser-EEPROM:. Fan:.
Clock(A/B):B Clock A:F Clock B:.
VTT1:. VTT2:. VTT3:.
Console>
STATUS LED - 橙色
假如系统软件不能启动,STATUS LED一直处于橙色,而且交换机进入ROMmon模式。请参考“将Catalyst 4000、5000和6000系列交换机从软件被破坏或残缺、升级故障或者ROMmon模式下恢复”文档,以了解如何从ROMmon模式恢复交换机。
SYSTEM LED - 橙色
橙色的SYSTEM LED说明出现稍微机柜告警信息,原因可能是下述的一种:
条件1-温度告警
发出“show system”命令来确定是否出现有效温度告警。在下面的范例输出中,“Temp-Alarm”域用高亮度显示。
Console (enable) show system
PS1-Status PS2-Status
---------- ----------
ok none
Fan-Status Temp-Alarm Sys-Status Uptime d,h:m:s Logout
---------- ---------- ---------- -------------- ---------
ok off ok 14,08:03:03 20 min
PS1-Type PS2-Type
------------ ------------
WS-CAC-1300W none
条件2-风扇故障或者部分电源故障
发出“show test”命令(不指定插槽号)来查看电源和电源风扇等系统硬件单元的状态。“show test”命令说明,有一个电源不能通过诊断测试(用F来表示)。
Console (enable) show test
Diagnostic mode: minimal (mode at next reset: minimal)
Environmental Status (. = Pass, F = Fail, U = Unknown, N = Not Present)
PS1: . PS2: N PS1 Fan: . PS2 Fan: N
Chassis-Ser-EEPROM: . Fan: .
Clock(A/B): A Clock A: . Clock B: .
VTT1: . VTT2: . VTT3: .
Supervisor 模块问题
Supervisor 模块无法识别/不能上线
假如您在Catalyst 6000交换机机柜中安装了Supervisor模块,而该模块没有被识别出来或者不能上线,则可以采用下面的推荐做法。
Supervisor 自己复位
假如您怀疑交换机自己复位,则您可以发出“show version”命令来确认交换机正常运行的时间(最后一次复位以后直至现在的时间)。您可以发出“show log”命令来查看重启动历史,如下所示。您还可以查看这个命令的输出,查看输出上是否有任何异常记录。
sup2a> (enable) sh ver
WS-C6506 Software, Version NmpSW: 6.3(10)
---- 输出抑制 ----
Uptime is 7 days, 4 hours, 27 minutes
sup2a> (enable) show log
Network Management Processor (ACTIVE NMP) Log:
Reset count: 1
Re-boot History: Jan 06 2003 10:35:56 0
Bootrom Checksum Failures: 0 UART Failures: 0
Flash Checksum Failures: 0 Flash Program Failures: 0
Power Supply 1 Failures: 0 Power Supply 2 Failures: 0
Swapped to CLKA: 0 Swapped to CLKB: 0
Swapped to Processor 1: 0 Swapped to Processor 2: 0
DRAM Failures: 0
Exceptions: 0
Loaded NMP version: 6.3(10)
Software version: slot0:cat6000-sup2.6-3-10.bin
Reload same NMP version count: 1
Last software reset by user: 1/6/2003,10:35:35
EOBC Exceptions/Hang: 0
Heap Memory Log:
Corrupted Block = none
上面的“show log”命令输出显示无软件异常,而且交换机最后一次启动的时间是2003年1月6日。从最后一次软件重启字段,您可以看到重启动时间也匹配。
下面的“show log”命令输出显示了在最后一次重启动时所记录的异常情况。假如您的交换机显示出现这样的软件异常状况,可以将“show tech”和“show log”命令的输出传送给TAC以寻求支持。TAC工程师将能够确认故障的原因。
esc-cat5500-b (enable) sh log
Network Management Processor (STANDBY NMP) Log:
Reset count: 38
Re-boot History: Oct 14 2001 05:48:53 0, Jul 30 2001 06:51:38 0
Jul 28 2001 20:31:40 0, May 16 2001 21:15:39 0
May 02 2001 01:02:53 0, Apr 26 2001 21:42:24 0
Apr 07 2001 05:23:42 0, Mar 25 2001 02:48:03 0
Jan 05 2001 00:21:39 0, Jan 04 2001 4:54:52 0
Bootrom Checksum Failures: 0 UART Failures: 0
Flash Checksum Failures: 0 Flash Program Failures: 0
Power Supply 1 Failures: 4 Power Supply 2 Failures: 0
Swapped to CLKA: 0 Swapped to CLKB: 0
Swapped to Processor 1: 3 Swapped to Processor 2: 0
DRAM Failures: 0
Exceptions: 1
Loaded NMP version: 5.5(7)
Reload same NMP version count: 3
Last software reset by user: 7/28/2001,20:30:38
Last Exception occurred on Oct 14 2001 05:47:29 ...
Software version = 5.5(7)
Error Msg:
PID = 86 telnet87
EPC: 80269C44
---- 输出抑制 ----
假如您的交换机显示这样的软件异常,您可以获取“show log”和“show module”命令的输出。使用“Output Interpreter(只供注册用户使用)”工具来对软件故障进行解码。假如发现问题,您就可以升级到已经修补了这个问题的软件版本。假如Output Interpreter工具也不能确认问题所在,则将“show tech”和“show log”命令的输出传给TAC获得进一步支持。TAC工程师将能够确认软件故障的原因。
Supervisor 处于ROMmon提示状态
交换机会由于下述原因进入ROMmon模式:
请参阅下述文档将交换机从ROMmon提示状态恢复:
NVRAM故障导致Supervisor故障,或者“show version”命令导致校验和故障
假如由于NVRAM单元故障而导致Supervisor显示“faulty”状态,如下面“show test”的输出所显示,并且“show version”命令导致校验和故障(如下面的命令输出所示),则您可能碰到了“Bug ID CSCdx87646”。这种故障在7.5(1)和以后的CatOS软件版本中得到了解决。
这将不会对一个运行状态下的交换机产生任何影响,除非在交换机处于这种状态时更改了配置。假如交换机复位,则可能丢失一些配置数据。在交换机复位之前,请确认您已经将当前配置的一份复制存储在其它设备中。这可以通过发出“show config”命令,并将它复制并粘贴到一个文本文件上来实现。发出“reset ”命令可以软复位Supervisor模块,可以清除这种条件。确认在复位交换机之前您已经有当前配置的复制。
Console> show test 2
Module 2 : 2-port 1000BaseX Supervisor
Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown)
ROM: . Flash-EEPROM: . Ser-EEPROM: .
NVRAM: F
EOBC Comm: .
Line Card Status for Module 2 : PASS
Port Status :
Ports 1 2
-----------
. .
Line Card Diag Status for Module 2 (. = Pass, F = Fail, N = N/A)
Module 2
Cafe II Status :
NewLearnTest: .
IndexLearnTest: .
DontForwardTest: .
DontLearnTest: .
ConditionalLearnTest: .
BadBpduTest: .
TrapTest: .
Loopback Status [Reported by Module 2] :
Ports 1 2
-----------
. .
Channel Status :
Ports 1 2
-----------
. .
Console>
Console> show version
WS-C6509 Software, Version NmpSW: 5.5(4b)
Copyright (c) 1995-2000 by Cisco Systems
NMP S/W compiled on Nov 26 2000, 12:28:35
System Bootstrap Version: 5.3(1)
Hardware Version: 2.0 Model: WS-C6509 Serial #: SCA0508004S
Mod Port Model Serial # Versions
--- ---- ------------------- ----------- --------------------------------------
1 2 WS-X6K-SUP1A-2GE SAD050806TA Hw : 7.0
Fw : 5.3(1)
Fw1: 5.4(2)
Sw : 5.5(4b)
Sw1: 5.5(4b)
WS-F6K-PFC SAD05090CR3 Hw : 1.1
---- output suppressed ----
DRAM FLASH NVRAM
Module Total Used Free Total Used Free Total Used Free
------ ------- ------- ------- ------- ------- ------- ----- ----- -----
1 65408K 38048K 27360K 16384K 6966K 9418K 512K 283K 229K
EXTBAN checksum failed.
VTP checksum failed.
Console>
线路卡/模块问题
线路卡不能识别/没有上线
您可能已经收到一个新的线路卡,但当您在Catalyst 6000交换机机柜中插入线路卡的时候,交换机上的“show module”命令不能识别插槽内所插的线路卡或者线路卡LED上的状态没有变绿。下面是解决这些问题的推荐做法。
参考下述文档以进一步了解Catalyst 6000的电源治理问题:
另一种常见原因可能是插槽中的线路卡没有正确安装。关闭交换机,取下该模块并检查背板上插槽连接器的管脚。在检测机柜背板上的连接器时您可能需要使用手电筒。试着重新将模块插上。确认两侧的螺丝都已拧紧,并且确认线路卡正确地插到机柜上。打开机柜的电源并查看状态。在一些情况下,没有插好的卡可能会导致类似于硬件故障的症状。没有插好的线路卡可能会导致背板上的业务被损坏,这可能导致在Catalyst机柜上出现不同的问题。例如,假如一个模块损坏了Catalyst背板上的业务,则这就有可能导致这个模块本身和其它模块的自检无法通过。重新安装所有的卡可以解决这个问题,并且成功通过自检。
假如您的线路卡仍然无法工作,则联系TAC以获得进一步支持。
运行CatOS的Catalyst 6000的WS-X6384模块端口连接故障排除
假如您同那些与WS-X6348模块或者其它10/ 100模块相连的主机之间出现连接问题,您可以参考下述文件以具体了解如何完成故障排除:
Supervisor的“show module”命令无法识别MSFC/MSFC 2
假如因为Cisco IOS软件镜像被破坏、没有正确安装bootflash或者出于一些原因使得MSFC或者MSFC2进入ROMmon状态,则MSFC/ MSFC 2可能在“show modele”命令输出中消失。下面的输出就是一个例子:
Cat6500 (enable) show module
Mod Slot Ports Module-Type Model Sub Status
--- ---- ----- ------------------------- ------------------- --- --------
1 1 2 1000BaseX Supervisor WS-X6K-SUP1A-2GE yes ok
Mod Module-Name Serial-Num
--- -------------------- -----------
1 SAD040200B3
Cat6500 (enable) session 15
Module 15 is not installed.
下面的例子是MSFC处于其它状态时“show module”命令的输出:
Cat6500 (enable) show module
Mod Slot Ports Module-Type Model Sub Status
--- ---- ----- ------------------------- ------------------- --- --------
1 1 2 1000BaseX Supervisor WS-X6K-SUP1A-2GE yes ok
15 1 1 Multilayer Switch Feature WS-F6K-MSFC no other
Cat6500 (enable) session 15
Trying Router-15...
!--- The session is not created.
!--- Hold down Ctrl and press C to escape.