传输常见故障解决方案

/ 2

传输常见故障解决方案

潘娜  张丽娜  陈可  孙海建

                                91917部队

传输故障定位的一般原则是“先抢通,后修复;先外部,后传输;先单站,后单板;先线路,后支路;先高级,后低级”。如何在实践中根据设备网管告警及利用仪表等,在最短时间内落实并处理故障,是每一位维护人员应该具备的业务素质。

    一、常见故障分类

    在日常施工和维护过程中,我们会遇到各种各样的故障,总体来说,可以归纳为以下几类:

  1、光缆线路故障。主要是光缆线路中断,光缆线路总衰耗过大、收发光弱等。   

    2、尾纤故障。主要是尾纤断,尾纤弯曲半径过小,法兰盘接头有灰尘及尾纤头脏等。

  3、单盘故障。包括线路板、2M板、时钟板、交叉板、主控板等器件损坏和由于环境、温湿度等影响板子正常工作等情况。

  4、电缆故障。包括2M电缆中断,DDF架侧2M接口输入/输出端口脱落或松动而造成的接触不良、2M头制作不规范及VDF架卡线松动等。

  5、电源系统故障。包括交流停电,设备直流掉电及熔断器故障等。

  6、网管系统故障。包括网管与设备之间的网线故障或系统异常而造成的ECC通道中断死机等情况。

二、故障定位的基本原则

(一)先抢通后修复

在出现故障时,我们要首先保证业务,然后再进行故障修复。如果存在影响业务情况下的传输网络告警故障,如在2Mbit/s业务通道出现LOS(信号丢失)告警,由于外线原因导致的收无光或收光弱告警,板件故障等情况下产生的故障,必须首先抢通业务。不过要想先抢通业务需要一个先决条件,那就是网络中有与故障通道相同起始点的可用通道资源。

(二)先外部后传输

    在处理故障时我们要先排除外部的可能因素,如断纤、终端设备故障、设备电源或机房环境配套故障等,然后进行传输系统原因查找。当可能存在外界因素影响而产生传输网络告警故障时,如设备温度告警、光路告警、网元失效告警也需照此办法处理。

(三)先单站后单板

    在查找传输设备故障原因时,我们需要先定位到单站点,再定位到对应板件。一般设备故障时,不会只是一个站点出现告警,至少存在本端和对端的问题。我们要分析和判断缩小范围,快速、准确地定位是哪个单站的问题,而后尽可能准确地将故障定位到单板。如处理光路误码、光功率异常等告警处理时,查看网管业务数据情况,对告警与性能事件进行分析。可采用环回法、替代法、数据分析法、仪表测试法来判断告警及故障产生的原因,将其定位到单板。

(四)先线路后支路

    在处理故障时,如果支路出现了大量AIS告警,这时需要先排除线路板故障再查看支路板故障。由于传输系统线路板的故障常常会引起支路板的异常告警,在处理告警时,应按“先线路后支路”的顺序,排除网管告警;如支路出现大量AIS则首先查看线路板是否出现LOS告警或其他异常告警,再查看支路板告警。

(五)先高级后低级

    在进行告警分析时,先分析高级别告警再分析低级别告警。特别是当高、低级别告警同时存在时,应首先分析级别高的告警,如紧急告警、主要告警,然后再分析低级别的告警,如次要告警、一般告警。处理告警时,我们要优先处理影响业务的告警。

三、故障定位方法

(一)故障定位的关键

    SDH设备的故障定位中,最关键的一步就是将故障点准确定位到单站。由于传输设备自身的应用特点是实现远距离的数据传送,一般站与站之间的距离较远,因此在进行故障定位时,首先将故障点准确地定位到单站,这样就可以集中精力和人力、设备来排除该站的故障。
(二)定位故障的一般过程

    1、检查光纤、电缆是否接错、光路和网管系统是否正常,排除设备外的故障。

    2、检查各站点业务配置是否正确,排除配置错误的可能性。

    3、通过告警性能来分析故障的原因。  

    4、通过逐段环回来进行故障的区段定位,将故障线路以设备端口、配线架、转换设备等为界面,划分为段,通过测试,将故障最终定位。

    5、通过更换单板来定位故障板。

    四、常见故障分析

(一)网管上报光信号丢失告警。

   1、检查光纤情况,检查光纤的槽位是否接错。 

   2、检查光线路板的收光功率,测试是否收发光不正常,调整光接口,观察告警是否消失。 
  3、检查上一点的的光线路板收发光情况,测试是否收发光不正常,调整光接口,观察告警是否消失。 

  4、如经过以上检查后,告警仍未消失,按照业务中断故障处理流程将光线路板自环检测定位故障点并解决故障。

    注意:当两站点过近时,必须通道衰耗问题,必要时添加光衰减器。 
(二)业务不通,同时无任何告警。 

  1、检查业务不通的站点之间是否打环,如果光口板之间存在环回,取消环回并正确连接即可。 

  2、如果没有环回存在,按照业务中断故障处理流程将光口板自环检测定位故障点。 

  3、确定故障光线路板,判断该板收发故障。因为当某块光口板收不到光信号,同时自己也检测不到故障时,该光口板可能不会告警对端光口板也无远端接收故障告警。 

(三)光板发光功率正常,但业务中断。

    1、检查与此两点间的光缆。 

 2、检查对端光板的光缆是否插好,灵敏度是否正常。 

    3、 在网管上检查数据配置,并确认网管上的配置与agent的配置是一致的。 

(四)2M业务不通。

    可通过查线—查线缆连接—查数据—查接口—查设备的流程进行分析。

  1、查看业务不通的2M业务的数量,如果数量很多,应首先考虑为光路问题。

  2、如果单个或几个2M业务不通时,检查是否为端口问题,环回是否正常,如果是数据配置问题,在网管重新配置正确的时隙。如果支路仍然没有信号,复位支路板,若没有其他硬件问题的话,告警会消失。

  3、如果业务仍然不通,按照故障处理流程对2M支路进行终端侧自环并挂误码仪检测。如果误码仪2M电信号丢失告警不消失,则判定原因可能是2M接口板的接口不好、2M线断或配线架同轴头未焊好,进行检查处理。
  4、设备投入使用时,2M业务不通,网管上查不出告警和性能用误码仪离线测试无误码。 

    产生这种现象的主要原因是ODF架没有接地或传输设备和用户终端设备之间没有共地,从而存在较大的压差,解决办法是把地线接好或共地。 

    注意:2M业务不通时,应留意地线的连接是否正确。

(五)误码类故障

    误码的处理要根据严重程度选择处理时间,如较为严重,则需立即处理,如不严重,则可保持现状,等到业务量少时(如傍晚或半夜)再处理。尽量缩小影响范围,尽量缩短影响时间。

  1、检查光板的收发光功率是否在指标内,如果两端光板的发光功率均在指标内,但收光功率低于指标要求或没有光输入,此时应检查尾纤是否清洁及光板收口到ODF的尾纤连接和耦合情况。

  2、如果在两端的ODF上的接收光功率都偏低或收无光,说明光缆线路有问题,必须联系光缆线路维护人员及时处理。

    3、利用网管,对通道进行环回测试如果自环后本光板没有再上报B1/B2性能,说明本光板无故障。同样自环对端光板后对端光板也没有再上报B1/B2性能,说明对端光板无故障。

4、检查光纤接头是否不清洁或连接不正确;光纤性能劣化、损耗过高;设备接地不好;设备附近是否有强烈干扰源;设备散热是否不好,导致工作温度过高。

    注意:若线路维护人员要使用OTDR测试光缆时,必须将ODF到光板的连接切断,避免OTDR发出的强光对光板造成损伤。

1