ATP设备无线连接超时典型故障分析

(整期优先)网络出版时间:2022-09-28
/ 2

ATP设备无线连接超时典型故障分析

李承广,焦捷 ,王维娜

中国铁路济南局集团有限公司济南电务段 山东济南 250000

摘要:通过研究CTCS-3级列控系统无线通信架构,结合现场ATP设备运用中发生的无线连接超时典型故障案例分析,总结故障经验,对提高故障分析精度和分析效率提供一定的技术帮助。

关键词:列控系统;无线超时;故障分析

1概述

随着我国高速铁路的快速发展,在CTCS-2级列控系统基础上集成了GSM-R无线控车技术的适用于350Km/h高速列车的CTCS-3级列车控制系统得到了广泛运用,CTCS-3级列控系统通过GSM-R网络实现车地信息双向传输,无线闭塞中心(RBC)将列车行驶区间的轨道电路情况、联锁进路等信息生成相应的行车许可、线路状态参数、临时限速数值等信息传送给列车,车载设备(ATP)根据这些信息控制列车安全运行。

在CTCS-3级列车运行控制系统监控列车运行的过程中,无线连接超时故障发生后车载设备(ATP)将输出最大常用制动控制列车降速,当无线连接未恢复达到降级条件下会降为CTCS-2等级降低限速运行。因此解决无线连接超时问题,在降低设备故障率、提高系统可用性以及减小列车运营影响等各方面存在重要意义。  

2 CTCS-3级列控系统结构及通信接口

CTCS-3级列控系统主要设备包括车载设备(ATP)、GSM-R网络传输设备及地面设备(RBC),车载设备和地面设备作为发送端和接收端,GSM-R网络设备作为传输通道来实现数据的交互。其中车载设备(ATP)主要包括安全计算机单元、无线传输控制单元及车载电台(MT单元);GSM-R网络传输设备主要包括基站(BTS)、基站控制器(BSC)和移动交换中心(MSC);地面设备(RBC)主要包括ISDN服务器及安全计算机单元。各设备间的主要接口包括Igsm-r、Um、Abis、A、PRI接口。通过各设备间的接口监测数据可以记录发生无线超时故障时底层数据流交互情况,可有效帮助故障定位。

3 无线连接超时典型故障分析

3.1 无线连接超时定义

根据CTCS-3级列控车载设备技术条件定义[1],当ATP从RBC最近收到的消息时间戳与车载设备当前时间的差大于T_NVCONTACT参数(20S),则认为无线超时,无线超时后ATP会输出常用制动,当列车速度降至CTCS-2级列控系统允许运行速度时,提示司机确认后,系统将自动转换为CTCS-2级进行控车。

3.2 无线连接超时故障分类

导致无线连接超时故障的原因有多种,依据设备类型主要可分为以下三类。

1、ATP设备原因。主要包括天馈线故障、无线传输单元故障、ATP软件逻辑、MT单元功能异常导致的接收质量差、异常脱网等方面。

2、RBC设备原因。主要包括安全核心硬件设备故障、RBC软件逻辑、ISDN服务器、RBC与MSC之间的传输异常等方面。

3、GSM-R无线网络原因。主要包括硬件设备故障、无线覆盖不合理、传输链路故障、网络参数设置不合理、同频干扰等方面。

当引起无线连接超时故障的原因初步定为在ATP设备侧时,需要进一步对车载侧数据进行分析。如果ATP设备出现多次无线连接超时的情况时,首先确认是否为一个MT单元过移交区的原因,该类问题在DMS(列控设备动态监测系统)关键文本信息中常伴有报警提示,可以作为辅助参考。当单次无线超时故障发生时,需要结合各接口数据分析无线连接中断的具体原因,从而综合定位故障点。本文主要对ATP设备原因造成的无线连接超时故障进行分析。

3.3 无线连接超时典型故障分析

3.3.1 MT单元上行发射异常

MT单元上行发射异常造成的无线连接超时,主要表现为Abis接口的测量报告显示上、下行接收电平差异过大(一般上行比下行差20dBm以上),导致MT单元的上行发射性能下降,影响无线通信功能造成无线连接的中断。

对于MT单元上行发射异常的预防和检测可以从两方面着手。一是利用接口监测系统实时监测MT单元的上、下行电平值情况,定期进行分析统计,发现存在劣化的异常情况时可以预防性更换。二是利用CTCS-3级列控系统电台检测工装[2]对MT单元的射频功能进行检测,发现指标异常时及时进行更换处理。MT单元射频功能检测主要从MT单元与网络的空口交互上,对MT单元的发射机和接收机性能进行检测,发射检测主要包括频率误差、相位误差(均方根与峰值)、发射功率、突发脉冲定时等技术指标。目前MT单元上行发射异常的情况在测试台的检测结果一般为发射功率过低。

3.3.2 MT单元SIM卡检测异常

MT单元SIM卡检测异常造成的无线连接超时,主要表现为MT单元在正常无线通信过程中突然掉网,可根据Abis和Igsm-r接口监测数据进行判断。Abis接口监测数据中可以看到BTS向BSC方向发送IMSI DETACH INDICATION(用户去附着消息),代表用户异常脱网;Igsm-r接口监测数据可以看到MT向ATP方向发送AT指令:+CME ERROR: 10,代表MT单元未能成功检测到SIM卡插入。

MT单元SIM卡检测异常的原因有多种,可能为MT单元卡槽松动导致的SIM卡接触不良,或SIM卡表层氧化、异物等导致的读取异常,也可能为MT单元工作异常无法正常读取SIM卡。故障原因可以通过故障恢复情况及现场检查进行综合判断,解决和预防手段主要可以从更换临近寿命期SIM卡及优化固定MT单元卡槽进行入手,MT单元工作异常需要结合故障情况进一步进行分析。

3.3.3 MT单元未正常起呼

MT单元未正常起呼造成的无线连接超时,故障主要表现形式为单MT过移交区。在PRI接口数据记录中只有一个MT单元的呼叫记录,在ATP数据中可以记录到主机检测到一个MT单元注册到网络的异常情况。

针对MT单元未正常起呼的情况,各设备厂家均制定了一定的解决措施。如300T型ATP设备通过STU-V-N单元实时监测双电台流控信号,当监测到一个MT单元注册到网络,且另外一个MT单元未正常注册到网络并持续5min后,会控制MT单元进行重启。300S及300H型ATP设备也根据电台不同异常场景对适配器增加了控制MT单元重启的功能。

DMS(列控设备动态监测系统)针对300T型ATP设备一个MT注册到网络的异常情况增加了报警功能,终端用户可以根据报警提示及时发现设备异常,并根据动车组运行情况及时进行应急处置。

3.3.4 MT单元异常转为空闲模式

MT单元异常转为空闲模式主要表现为Igsm-r接口数据中记录MT单元工作中突然向ATP发送AT命令NO CARRIER,电台由工作模式转为待机模式,Um接口数据中记录MT单元向RBC方向发送DISCONNECT信令挂断网络通信,PRI接口数据显示网络侧挂机,最终造成无线连接超时。此类故障一般为电台偶发性工作异常导致,可以对MT单元进行高温拷机测试观察运用情况。

3.3.5 ATP软件逻辑异常

软件逻辑异常主要表现为具有共同点的故障重复出现,但发生的时间、线路位置、设备均不相同。目前现场运用中发生的软件缺陷主要有:

1、300S型ATP设备RIM单元软件逻辑异常导致未能正常发送SABME帧。

2、300S型ATP设备MT单元软件逻辑异常不响应ATS128指令。

3、300T型ATP设备单MT过移交区触发的主机5分钟定时器复位异常的软件逻辑问题。

300S型ATP设备通过软件升级已解决RIM单元不发送SABME帧的软件缺陷,并针对MT单元不响应ATS128指令的场景增加了适配器控制MT单元重启的功能。软件逻辑类故障主要通过故障数据库的积累及共同点的分析来查找软件逻辑缺陷,进行优化解决。

4 结束语

在CTCS-3级列控系统中发生的无线连接超时故障,通过利用各设备间的接口监测数据可以达到快速分析判断故障的目的,同时合理利用各类监测报警装置,可以有效进行故障预防,提前发现设备隐患,减少无线超时故障的发生。

参考文献


[1]国家铁路局.QCR744-2020CTCS-3级列控车载设备技术规范》.

[2]马俊,赖平.CTCS-3级列控系统电台检测工装的研究和实践.铁道通信信号.2021年第11