基于故障树的空管席位KVM架构体系可靠性分析

(整期优先)网络出版时间:2023-10-17
/ 2

基于故障树的空管席位KVM架构体系可靠性分析

章典

(民航机场规划设计研究总院有限公司西南分公司 成都 610213)

摘要:现有管制大厅席位设备部署通常采用单个席位独立部署显示器和工作站,机房部署服务器,形成C/S架构。近年在部分机场采用的KVM分布式部署,实现了工作站的保障不在局限于单独席位,提高了部署和维护效率,本文将利用故障树分析方法对该体系下管制大厅的故障概率进行分析,对比现有部署方式提出新旧体系下故障要点和稳定性差异。

1引言

目前,我国民航系统共建成8个大型区域管制中心,划设高空管制区15个、中低空管制区28个,形成了无缝衔接的管制服务网络,各级管制中心承载着我国每日超过1万架次的航空安全保障。根据我国区域管制中心建设标准,在区域管制大厅内应配置空中交通自动化系统、综合信息显示系统等大型业务系统,管制中心整体的冗余和稳定直接关系到我国民航安全保障能力。

随着分布式动态图像处理的成熟,空中交通管制中心也正在尝试从传统各席位孤立式保障向分布式转变。目前针对空管管制大厅席位可靠性研究主要针对于自动化系统本身各软件模块、硬件[[1]][[2]],未考虑在管制席部署方式对管制大厅运行可靠性的影响。在新的架构下,需重新建立空管管制信息系统可靠性评估方式,确定影响系统可靠性的关键因素

2管制大厅管制席位部署需要

按照现有管制中心使用需求管制大厅席位上至少应包含航管自动化系统、信息显示系统等桌面操作系统,其中航管自动化系统是国际常用的空中交通管理平台,系统按照系统设计需要被分成不同的功能处理模块,部署于不同的服务器上,全部模块\服务器均按照主备方式建设,传输网络按照三个独立网络提供。

自动化系统作为管制的核心系统,一旦设备故障需立即启动备份系统或启用备份席位,而信息显示系统作为重要管制辅助信息查询,该系统故障会对管制造成较大影响,但具备一定的容忍度,因此本文席位故障仅考虑自动化系统的故障。

在每个管制大厅按照航空业务需求部署日常开放使用的管制系统,按照一定比例在管制大厅部署备份管制席位,在某席位单元出现前端软件或硬件故障时,管制员可立刻启用备份管制席位。

3 故障树理论

故障树是一种特殊的逻辑图,基于故障树的诊断方法是一种由果到因的分析过程,它从系统的故障状态出发,逐级进行推理分析,最终确定故障发生的基本原因、影响程度和发生概率[[3]]。系统故障称为故障树的顶事件,以符号S表示,系统各部件的故障称为底事件,如对系统和部件均只考虑故障和正常两种状态。

定义系统故障为:

不同的底事件按照逻辑关系可以形成不同的故障树结构,典型故障树结构如“与门”和“或门”结构,其结构函数与逻辑图分别如下:

(与门逻辑函数)

(或门逻辑函数)

对于“与门”结构当输入事件同时发生时输出事件才发生或者输入事件的状态变量全部为1时输出事件状态变量才取1。

对于“或门”结构当输入事件只要存在1件发生的底事件,则输出事件发生或者输入事件的状态存在不为0的情况,则输出事件状态变量就将取1。

当底事件触发数量超过备份底事件数量时,顶事件才处于故障状态,称为表决门。

 

对于底事件其发生概率为,当各个底事件为相互独立事件时,在与门故障数结构下其发生概率

在或门故障树结构下其发生概率

对于表决门结构,其表征为故障席位数量大于备份数量时系统判断为故障,由于每个席位设备配置一致,管制大厅内席位故障概率符合二项分布,

4 管制大厅前端设备失效模型及定量分析

4.1传统部署方式故障树分析

由于新架构未对自动化系统本身稳定性造成影响,因此本文旨在对前端系统架构调整造成的整体系统故障率进行分析。传统部署方式下,管制大厅席位上将配备FDD和SDD显示、主备自动化工作站及其主备切换器,工作站通过切换器连接至显示器,主用工作站故障时,管制员可切换至备用工作站。

图1 传统部署架构故障树

对于传统架构,当管制大厅故障席位数大于备份席位需求时,则认为管制大厅无法对辖区内航班进行有效管理,管制大厅失效即为顶事件,由于每个席位相互独立,因此大厅失效T的底事件为单个席位失效。则对于大厅总席位数量为,备份席位数量为的管制中心。得到管制大厅故障概率为

其中表示每个席位整体故障率:

4.2 KVM坐席部署方式故障树分析

KVM分布式坐席协作技术将传统的系统前端-系统后台模式,细分为显示交互-前后端互联-端处理池-系统后台,自动化系统本身架构不变,在新架构体系下,自动化系统席位工作站将不在按照席位分别安装在席位桌内,而是统一与服务器一同安装于设备机房,每个席位管制员可以通过KVM管控输出盒选择连接至交换矩阵的任意工作站,这使得管制员可以在工作站软、硬件故障时实时切换使用端处理池中任意未占用工作站。

图2 KVM坐席部署架构故障树

得到其故障概率为

其中分别表示显示系统故障、工作站系统故障和KVM系统故障:

按照区域管制中心配置标准,备份席位按照管制席位3:1进行配置,综合协调、主任、流量管理等席位,备份席位占全部大厅席位约1

2.5%,自动化系统工作站MTBF为1万小时,KVM设备MTBF为20万小时,显示设备为10万小时,以3天为维修周期,得到不同规模管制大厅整体故障率表如下:

表1不同规模管制大厅整体故障率表

备份席位数量

传统部署方式管制大厅故障率

KVM坐席部署方式

显示故障率

工作站故障率

KVM交换矩阵故障率

管制大厅故障率

1

2.49e-03

1.29e-04

2.40e-06

1.29e-07

1.31e-4

2

4.53e-04

5.51e-06

5.04e-08

1.29e-07

5.69e-06

3

7.80e-05

2.22e-07

9.43e-10

1.29e-07

3.53e-07

4

1.33e-05

8.98e-09

1.75e-11

1.29e-07

1.38e-07

5

2.29e-06

3.64e-10

3.29e-13

1.29e-07

1.29e-07

6

3.97e-07

1.48e-11

6.24e-15

1.29e-07

1.29e-07

7

6.90e-08

6.10e-13

1.19e-16

1.29e-07

1.29e-07

8

1.20e-08

2.52e-14

2.31e-18

1.29e-07

1.29e-07

9

2.11e-09

1.26e-15

4.52e-20

1.29e-07

1.29e-07

10

3.72e-10

6.30e-17

8.88e-22

1.29e-07

1.29e-07

图3 不同部署方式故障率取对数后变化曲线图

4.3小结

通过计算结果可以看出,KVM部署方式可以充分缓解工作站故障带来的系统性风险,在规模较小的管制单位,如塔台、进近管制室,可大幅降低运行风险,提供管制员使用体验,优化维护工作流程。

根据传统部署模式故障树计算模型和计算结果可知,管制大厅的失效概率与备份席位数量基本呈指数级关系,但是在KVM部署方式时,显示系统、工作站系统故障率将随着席位数量增加而快速降低,但是主、备机模式的KVM交换矩阵故障率为固定值,因此管制大厅失效率将随着管制席位的增加而逐步收敛至KVM交换矩阵故障率,因此KVM主备交换矩阵部署方式不适用于大型管制系统

6 结论

采用KVM坐席部署将大大降低工作站故障带来的席位失效率,降低设备故障对航空管制效率和安全保障水平的影响,同时工作站的集中管理也可降低工作站本身的故障概率,在中小规模管制现场具有较高的应用价值。而在大规模管制现场,主备KVM交换矩阵则会使管制大厅的可靠性受限于KVM系统的稳定性,因此在实践中大型管制现场,将主备KVM交换矩阵替换为1主多小交换矩阵方式,以此降低管制大厅失效概率。

参考文献:


[1]梁巧琴.故障树分析在AIRNET航管自动化系统分析中的应用[J].信息通信,2015(04):36-38.

[2]王兴隆,刘卫香.基于故障树的空管自动化系统分析[J].航空计算技术,2009,39(03):18-21+33.

[3]陈珊琦. 故障树和事件树建模与分析的关键算法研究[D].中国科学技术大学,2015.

作者简介章典,男,硕士研究生,民航机场规划设计研究总院有限公司西南分公司,主要从事民航机场、空中交通管制部门空管专业工程设计工作。