为排除光传输设备的故障,最要害的一步是根据网管和设备架、板告警的具体情况,将故障点准确地定位到单站,这是维护人员在现场维护工作中必须牢固树立的观念.
我们都知道,故障定位的一般原则是“先外部,后传输;先单站,后单板;先线路,后支路;先高级,后低级”.如何在实践中根据设备网管告警及利用仪表等,在最短时间内落实并处理故障,是每一位维护人员应该具备的业务素质.
1 从功能块告警流程图分析判定告警及原因
(1)对于相邻两个网元,在网管上都有R-LOS、R-LOF告警,而没有MS-RDI、MSREI,说明光缆很可能中断,因为远端劣化指示和远端误码指示无法回传.
(2) 假如相邻两网元本端有R-LOS、R-LOF告警,另一端有MS-RDI、MSREI,说明远端劣化指示和远端误码指示能够回传,可能是光纤单断或尾纤头脏、衰耗大,或本端收光板或对端发光板有故障.
(3) 假如当前网元的东、西两个相邻网元都有相应的R-LOS和R-LOF,并且当前网元无法登陆,一般情况为当前网元掉电,造成两个方向光路不通.
2 单站中常见故障及原因
2.1网元无法登录,ECC不通
(1) 假如一个或部分网元无法登录,那么其原因可能是:(a) 光路衰耗大,误码过量,导致ECC通路不通;(b) 主控板故障;(c) SCC板ID拔码不正确;(d) 网元掉电、断纤.
(2) 假如全部网元不能登录,则原因可能有:(a) 网管网元SCC主控板故障;(b) 网线、网卡故障;(c) 计算机ip地址和网关网元IP地址不正确.
2.2公务电话不通及其原因
(1) 假如在设备调测开通期间公务不通,原因可能有:(a) 公务电话参数配置错误;(b) 开销板配置不正确;(c) 光纤连接不正确.
(2) 假如在运行中公务忽然不通,原因可能有:(a)铃流板故障;(b) 公务电话损坏;(c)公务电话P/T和RING开关错误.
2.3系统时钟故障及原因
(a) 时钟源级别设置错误;(b) 时钟板故障导致线路时钟失锁;(c) 光纤反接导致两网元时钟互跟;(d) 线路板故障;(e)交叉板故障.
2.4常见业务故障
(1) 某2 Mbit/s输入中断告警时,原因可能有:(a) 外部设备输入中断;(b) 2 Mbit/s同轴电缆故障;(c) 电缆头焊接脱落;(d) DDF架头松动;(e) 支路板故障.
(2) 某一个VC4通道告警,原因可能有:(a) 时隙配置参数改变;(b) XC4交叉板故障.
(3) 光路不通有R-LOS、R-LOF告警,原因可能有:(a) 断纤;(b) 光纤性能劣化;(c) 尾纤头太脏,衰耗过大;(d) 光板故障,发射或接收光功率异常;(e) 使用光板型号不对.
(4) 误码过量时,设备外部原因可能有:(a) 光纤性能劣化,损耗大;(b) 光纤接头太脏,或连接不正确;(c) 设备接地不良;(d) 设备四周有强烈干扰源;(e) 设备散热不良,工作温度高;(f) 传输距离过短或过长.
设备内部原因可能有:(a) 线路板接收侧衰减过大;(b) 对端发送电路故障,或本端接收电路故障;(c) 时钟同步性能不好;(d) 支路板故障;(e) 风扇故障.
(5) 保护倒换失败及原因
单向通道保护环:(a) 逻辑系统属性配置错误;(b) 支路板通道保护属性配置错误;(c) 支路板、线路板和主控板故障.
复用段保护环:(a) 复用段节点参数改变;(b) 保护倒换协议状态不正常;(c) 交叉板、主控板或线路板故障.
3 维护中常见的人为故障
维护中常见的人为故障有:
(1) 更换光板时型号不统一,造成光功率过载或太低,导致光路不通,产生RLOS或误码过量等故障;
(2) 在多个2 Mbit/s口同时处理和开通时,不同的2 Mbit/s线收发交叉互配,造成数据业务不通;
(3) 更换SCC主控板后,忘记拔动或错误拔动ID码,导致网元无法登录;
(4) 公务在使用中P/T或RING开关位置错误,导致公务不通;
(5) 风扇长期不清,导致设备产生大量指针调整和误码;
(6) 网管添加业务时不规范,发生时隙冲突,导致业务中断;
(7) PGND接地不良,造成单板频繁损坏和误码;
(8) 光缆错误连接导致全网业务中断;
(9) 市电接入电源设备时,火线零线反接,导致SCC板反复复位;
(10) 尾纤保护不到位,导致老鼠咬断尾纤,光路中断.
各种常见故障的处理流程图见图1~图6.
4 结束语
如何查找光传输设备常见故障的原因,如何及时准确地判定和处理这些故障,对维护人员来说是非常重要的,只有及时准确地判定和处理这些故障,才能给用户提供优质的网络服务.以上是笔者在实际工作中总结出的判定和处理故障的一些经验,供同行参考.在维护中还有很多问题和经验需要我们不断地发现和总结,只有不断提高维护水平.由于本人水平和能力有限,难免存在一些问题,请同行批评指正