故障树分析结合故障字典在电子设备故障诊断中的应用

(整期优先)网络出版时间:2021-11-01
/ 3

故障树分析结合故障字典在电子设备故障诊断中的应用

江维

西南电子设备研究所,四川成都 610036


摘要:本文提出一种将传统故障树分析算法与故障字典相结合的电子设备故障诊断方案。利用被测电子设备的设计资料及技术参数作为故障字典输入,配合建立的故障树进行定性分析,以决策故障检测顺序及故障检测点,降低故障诊断复杂性,提高故障诊断效率。此外,本文以某型出口雷达中的数字串行I/O模块的故障隔离过程为例,对此方法进行示例说明。

关键词:故障树分析算法;故障字典;故障隔离;电子设备


1引言

随着现代电子技术的快速发展,电子设备已高度集成化、复杂化、多样化,导致维修保障的难度急剧增加。原先依靠维护人员借助简s单仪器对故障设备进行修复的方法越来越难以满足社会的需求,尤其是在军队装备快速发展的今天,需要在战时对武器装备出现的故障进行快速定位和修复[1]。因此,如何即快又好地分析判断故障,对于电子设备的维修保障具有十分重要的意义。

当前,电子设备的故障诊断方法多种多样,最长见的有故障字典法及故障树分析算法。两类算法各有优劣,如何将两者合二为一,对于进一步提高电子设备的故障诊断效率具有重要的现实意义。

2故障树与故障字典结合模型

故障树分析(Fault Tree Analysis,FTA)是在上世纪60年代,由美国Bell实验室提出,并且之后被成功应用于美国空军的"民兵洲际弹道导弹"的发射控制中[2]。故障树分析法是一种以树形结构将系统故障形成的原因由总体至部分按树枝状逐级细化的方法。故障树则是由各种事件符号和還辑组成的一种树形结构,事件之间用不同的逻辑门来表示相互的逻辑关系。通过对可能造成故障的硬件、软件等因素进行分析,建立设备/系统的特定事件(即顶事件)与其各子系统或各部件故障事件(即底事件/基本事件)之间的逻辑结构[2]。通过故障树定性分析,求取故障树的最小割集(MCS)及故障树顶事件发生概率,从而确定设备/系统的故障检测顺序及故障检测点。

故障字典本质是一个数据库,用来对被测设备/系统进行故障诊断[3]。故障字典法诊断故障的基本思想是: 首先提取系统或设备在各种故障状态下的系统特征,如系统内各部件的工作状态、测试点的状态信息等,然后将特征与故障对应关系列成一个字典。在测试时,通过获得系统或设备的实际特征,从故障字典中查出此时对应的故障[4]

从故障树分析及故障字典两种故障诊断方法的工作机理分析,两者若单独使用均存在一定弊端:故障树分析反映了基本事件、中间事件及顶事件的关系,但故障树的建立及最小割集的求取均需预先从专家知识库获取设备/系统的工作原理及子系统或各部件的故障发生概率,测试时故障特征的提取也需从特定数据库中提取;故障字典反映了想象故障与故障原因之间的经验,只能在所选择的故障范围内作诊断,且故障多为单故障因素引起的故障判断,故障发生时无法清晰判断设备/系统的故障检测顺序及故障检测点。

因此,将故障树与故障字典相结合进行故障诊断,有利于区分故障等级、锁定故障范围,以便快速准确的确定故障部件及故障检测点,实现设备/系统的快速修复。

在对已完成设计使用的电子设备测试及故障诊断时,由于硬软件设计状态已固化,可简化故障字典生成流程,将被测电子设备的设计资料及技术参数作为为故障字典输入。基于此,本文建立的将故障树与故障字典相结合完成故障判定的工作模型如下图1所示。

617f5e10f3d9a_html_a2b7e9381e9760b5.gif 图 1 故障判定工作模型

测试过程发生故障时,首先利用故障字典与故障树结合的故障分析模型进行系统分析,确定故障原因,具体过程如下:建立的故障树向故障字典发出故障权重请求,故障字典则根据请求向故障树提供设备/系统各组成部件的故障权重(故障发生概率),故障树以此完成最小割集MCS的求取及故障隔离顺序。根据故障隔离顺序,引导测试资源自动对内部各组成部件遍历测试,每个测试结果均与故障字典提供的故障特征一一匹配,若匹配成功,则此次故障判断完成,故障隔离结束,否则再次进入故障分析模型进行逻辑推理,直至获取准确的故障原因为止。

3故障树与故障字典结合模型应用实例

以某型出口雷达中的数字串行I/O模块的故障隔离过程为实例,对此模型进行示例说明。

数字串行I/O模块的主要功能是通过通信控制芯片将外部送入到缓存器中的数据按一定时序送出。在详细分析该模块的电路功能结构的基础上,建立故障树如下图2所示。

617f5e10f3d9a_html_9879da80975e0cc0.gif

图 2 数字串行I/O模块故障树

图中,故障树符号代码表示如下表1所示。

表1 数字串行I/O模块故障树符号

符号

定义

符号

定义

T

数字串行I/O模块故障

X3

D7电压转换芯片

G1

电压转换故障

X4

D11通信芯片故障

G2

串行通信故障

X5

D12缓存器故障

G3

通信线路1故障

X6

T1时钟故障

G4

通信线路2故障

X7

D21通信芯片故障

X1

D1控制芯片故障

X8

D22缓存器故障

X2

D5电压转换芯片故障

X9

T2时钟故障

通过故障字典查询各组成器件的故障发生概率,统计如下表2所示。

表2 数字串行I/O模块组成器件故障发生概率

序号

符号

定义

发生概率

1

D1

控制芯片

1*10-3

2

D5

电压转换芯片

2*10-4

3

D7

电压转换芯片

1.8*10-4

4

D11

通信芯片

1.4*10-3

5

D12

缓存器

6*10-5

6

T1

时钟

1*10-5

7

T2

时钟

1*10-5

8

D21

通信芯片

1.4*10-3

9

D22

缓存器

6*10-5

利用故障分析算法中常见的Semanderes算法(即上行法)对此模块的故障树进行定性分析寻求最小割集过程如公式(1)~公式(5)所示。

故障树底层为:

617f5e10f3d9a_html_28442e6ffaa2c659.gif

617f5e10f3d9a_html_f9a1bef2e9dc0356.gif

同时有:

617f5e10f3d9a_html_7b655ccd4d192e1d.gif

617f5e10f3d9a_html_bb5b1f1825f20938.gif

顶事件T可表示为:

617f5e10f3d9a_html_ed976db322383ef0.gif

即,该模块故障树的最小割集MCS有{X1},{X2,X3},{X4,X7},{X4,X8},{X4,X9},{X5,X7},{X5,X8},{X5,X9},{X6,X7},{X6,X8}和{X6,X9}。

根据求出的最小割集计算顶事件数字串行I/O模块故障发生概率如下表3所示。

表3 数字串行I/O模块故障发生概率

序号

最小割集

对应器件

发生概率

1

X1

D1

1.00*10-3

2

X2,X3

D5,D7

3.60*10-8

3

X4,X7

D11,D21

1.96*10-6

4

X4,X8

D11,D22

8.40*10-8

5

X4,X9

D11,T2

1.40*10-8

6

X5,X7

D12,D21

8.40*10-8

7

X5,X8

D12,D22

3.60*10-9

8

X5,X9

D12,T2

6.00*10-10

9

X6,X7

T1,D21

1.40*10-8

10

X6,X8

T1,D22

6.00*10-10

11

X6,X9

T1,G2

1.00*10-10

根据故障树分析的故障诊断策略,当最小割集MCS值越大,则故障发生可能性越大,故障隔离的顺序也越靠前。按照此策略,引导自动测试系统对最小割集的器件进行单独测试,并将测试结果与故障字典匹配,若匹配成功则故障隔离成功,该器件即为故障器件。若匹配失败,则继续测试下一器件,直至找到最终发生故障的器件。整个故障隔离流程如图3所示,图中每个SUB包含的都是针对标注的当前器件的测试子流程。

617f5e10f3d9a_html_19abfd7ddf30d1a4.gif

图 3 数字串行I/O模块故障隔离TP

按照此流程,自动测试系统对数字串行I/O的故障隔离结果如下图4所示。

617f5e10f3d9a_html_965b11748e6656c7.png

图 4 数字串行I/O模块故障隔离结果

4结束语

同传统的如探笔诊断等故障诊断方式相比,将故障树分析与故障字典相结合的故障诊断方式虽然对测试TP要求更高,但诊断速度更快、工作量更小,可有效提高电子设备的故障隔离效率。同时,此种方式也可避免因对被测设备中无关部件测试,而引发的不必要硬件破坏,使故障隔离简单且更加易于实现,此方法在军用电子设备的外场故障隔离中具有更加重要的现实意义。


参考文献

[1] 俞顺鑫. 基于故障字典法的模拟电路故障诊断系统的研究. 华中科技大学. 2019.05

[2] 李莉. 故障字典技术在机载电源系统故障诊断中的应用. 电光与控制. 2015.11

[3] 宋斌,方葛丰. 数字测试中的故障字典技术. 电子测量与仪器学报. 2014.05

[4] 刘伯鸿. 故障树与故障字典法结合的计算机连锁系统故障诊断. 铁道通信信号. 2008.12

[5] 曾希雯. 基于故障字典的电路故障诊断研究. 电子科技大学. 2016.06


4 / 4