滑动窗口解决空管自动化系统监视数据告警

(整期优先)网络出版时间:2022-09-27
/ 2

滑动窗口解决空管自动化系统监视数据告警

冯蕾

中国民用航空西南地区空中交通管理局贵州分局  贵阳  550012

摘 要:在自动化系统安装调试过程中出现了监视数据频繁提示监视数据扇区丢失超限的告警信息。通过抓包、参数分析、告警原理分析等方法排查,原因为其参与告警的数据时间门限太窄,采用滑动窗口的告警阈值判断方式,减少了该项告警的频繁出现。

关键词:扇区丢失;虚警;告警门限;滑动窗口.

0.引言

监视数据是空管自动化系统中非常重要的输入源,将各类监视数据进行融合后给管制提供航迹信息是自动化系统的重要功能之一,而前置处理服务器负责对所有接入自动化系统的数据源进行格式转换、坐标转换、相关参数解析[1],当解析的结果不满足系统设置需求则进行告警。此时需要技术维护人员将不满足标准的监视源从系统中屏蔽,避免不合格的单路监视源影响综合航迹的位置,给管制指挥带来安全风险。

基于此,当系统出现监视源相关告警时,技术人员需提高警惕,尽快找到告警原因,提出切实可行的解决方案。

1.现象

某自动化系统A监控主机上每隔5-6秒频繁出现某监视源RZT的扇区丢失超限告警sector lost overload,对应服务器包括监视数据前置处理器SDFP1、SDFP2以及旁路监视数据处理器BSFP。告警信息如图1所示。而现场另一套自动化系统B未出现此类告警。

图1 告警信息

2.基础知识

2.1监视数据:监视数据时自动化系统必不可少的数据来源,主要用于形成综合航迹供管制员监视空中飞行器态势。目前监视数据包括雷达数据、ADSB数据、多点数据等,根据不同的特点,各类监视数据在系统内部处理的方式有所区别[2]

2.2时间滑动窗口:

为了提升数据的平稳性,将某个点的取值扩大到包含这个点的一段区间,用区间来进行判断,这个区间就是窗口。滑动窗口[3],又称rolling window。为了解决计数器统计精度太低的问题,引入了滑动窗口。如图2所示,解释了滑动窗口算法:

图2 滑动窗口

在上图中,整个红色的矩形框表示一个时间窗口,例如一个时间窗口就是一分钟。然后我们将时间窗口进行划分,比如图中,我们就将滑动窗口划成了5格,所以每格代表的是12秒钟。当新数据到达时,时间窗口向后移,即每过12秒钟,我们的时间窗口就会往右滑动一格。再以序列的第二个点为起始单位,形成另一个长度为5 的窗口,依此类推,周期性地计算当前滑动窗口的平均值。

2.3扇区丢失率计算

监视源以雷达为例,将360°进行平均分配为32份,每一份为360/12=11.25,即每扫描11.25°发送一份扇区报,正常情况下,总计发送32份扇区报,且需在一个雷达周期内完成32份扇区报的发送。

总扇区数-收到扇区数=丢失扇区数

丢失扇区数÷总扇区数x100%=扇区丢失率

3.排查过程

步骤1:通过抓包发现收到的雷达数据存在扇区报丢失的情况。

步骤2:对比现场另一套自动化系统B的情况

根据现象,观察该监视源在自动化系统B未出现此类告警,并且通过观察监视源RZT在自动化系统中的目标航迹正常,未出现目标分裂、偏移等异常情况。

步骤3:对比现场两套自动化系统的监视源接入方式

现场两套自动化系统的监视源接入方式如图3所示,均为串口转网络,通过分配盒接入自动化系统。由于监视源数据接入现场两套自动化系统的方式一致,且来自相同的数据源。判断监视源接入方式不是造成告警的原因。

图3 监视源接入方式

步骤4:对比两套自动化系统对扇区报丢失的告警参数配置

产生告警的自动化系统A的参数设置分别是质量监控时间窗口配置4秒,主用通道数据必备项丢失率大于20%,如图4,图5。即在质量监控时间窗口4秒内,若CRC校验、数据项丢失率、正北扇区丢失率大于所设参数则进行相应告警。

图4 自动化系统A的参数设置

图5自动化系统A的数据项丢失率

4.告警机制

自动化系统A:系统每个周期计算一次扇区丢失率,当在质量监控时间窗口配置的参数时间内的每个周期的平均丢失率大于主用通带数据必备项丢失率的参数值时,则在监控终端SMC上输出该监视源“sector lost overload”字样的告警。通过联系自动化系统告警参数配置发现,自动化系统A的参数为4秒,即每个周期进行一次告警计算,当监视源扇区报缺少则进行告警。

而自动化系统B对雷达质量的关键参数只配置切换通道的阈值,而不具备对关键参数进行告警的功能。如图6是自动化系统B的参数配置。即CRC:CRC校验;Format Error:格式错误;Sector Lost:扇区丢失,其中Absolute代表绝对值大于所设参数,且Delta相对值大于所设参数,则进行通道切换,否则不切换。

图6 自动化系统B的参数配置

5.解决方法

为了不让监视数据的扇区报丢失产生虚警,需要对自动化系统A的告警时间区间进行调整,将质量监控时间窗口从4秒调整为60秒,如图7。

图7质量监控时间窗口参数

即采用了时间滑动窗口进行告警值的平滑处理。如图8,一个格子为监视源发送数据的一个周期4秒,将窗口由4秒调整为60秒,即在15个周期内计算扇区报丢失率的平均值,当平均值大于配置的参数20%,才产生告警。

图8告警值的平滑处理

通过使用时间滑动窗口算法计算告警时间后,进行了测试,将修改后的算法应用到监视数据前置处理器SDFP1和旁路监视数据处理器BSFP中,查询了11月30日至12月1日共计2天的告警记录,发现监视数据前置处理器SDFP1和旁路监视数据处理器BSFP中未出现扇区丢失超限的告警,而维持原状的监视数据前置处理器SDFP2仍然有扇区丢失超限告警,说明使用时间滑动窗口算法计算告警时间抑制了扇区报丢失的告警问题。如图9所示。

图9告警界面

在将监视数据前置处理器SDFP2也进行算法改进后,观察监视源RZT的航迹发现未出现分裂、偏移等异常情况,说明使用时间滑动窗口算法计算告警时间成功解决了扇区报丢失的虚警问题。

6.总结

在发现自动化系统出现扇区丢失告警后,通过抓包、参数对比、告警原理分析等方法找到告警原因,并通过修改滑动窗口的告警阈值方式,减少了该项告警的频繁出现,使得该自动化系统对于监视数据的监视更加精确,避免了虚警的出现。

参考文献:

[1] 华炜.浅析标准雷达数据格式ASTERIX[J].民航科技,2003(9):14-16.

[2]陈微波.雷达数据格式转换[J]昆明理工大学学报,2005(8):390-393.

[3] 谭宏强,牛强.基于滑动窗口及局部特征的时间序列符号化方法[J].计算机应用研究,2013,30( 3) : 796-798.

作者简介:

作者姓名:冯蕾,1987年出生,女,籍贯:贵州,苗族,硕士研究生,民航贵州空管分局技术保障部机务员,主任工程师,研究方向:计算机科学。