基于语音识别的管制语音通话分析技术研究

(整期优先)网络出版时间:2023-02-14
/ 2

基于语音识别的管制语音通话分析技术研究

刘知青1刘亚丽2陈思3朱乾4李宏浩5

中国电信股份有限公司贵州分公司  贵州省  贵阳市  550000

摘要:通过对管制运行的实际情况分析,管制员在管制过程中能够掌握不同时刻航班的运行情况,掌握管制员语音通话的实时信息,并在此基础上作出相应及时指挥,从而有效保证管制运行的安全。本文将对基于语音识别的管制语音通话分析技术展开研究。

关键词:语音识别;管制;语音通话;指挥决策

1 引言

随着我国民航事业的快速发展,在空中交通管理中日益发挥着越来越重要的作用。但由于其使用人数众多且复杂、运行频率不稳定、飞行员流动性大等原因,造成了飞行员与管制员之间的沟通成本非常高,这也直接造成了我国空中交通管理效率低下的现象。因此通过基于语音识别的管制语音通话分析技术,将能够对航班运行信息进行分析,能够有效降低飞行员与管制员之间通信成本,提高运行效率。以下将对其展开分析探究。

2 语音识别概述

语音识别主要是通过语音信号的加工和识别实现对人声音的识别和理解。从根本上说,语音识别系统是一个模式识别系统,其主要包括三大部分内容:特征提取、模式匹配和特征库。

首先对所接收到的语音进行预处理,再根据这些特征构建相应的模块。在进行语音识别时,首先要对输入的语音进行特征提取,并将存储在电脑中的语音模板与输入的语音信号进行对比,而后利用特定的检索与匹配策略,找到与输入语音相对应的模板,再根据该模板的定义,对所生成的数据进行查找。

而特征识别是指将使用者的语音数据与语音训练的语音及语言模式进行比较,以达到最佳的效果。在识别过程中,一般会有一个前端处理模块,其主要功能是增强语音识别系统对噪声的抗干扰,从而对识别结果的正确性产生重要的影响。另外,在特征识别中还包含了一个反馈模块,期间通过对输入的语音特征的自我训练,将能够有效提升语音模型的精准性。

3 管制员与航空系统间的通话

航空作为现代重要的运输方式之一,民航的空中交通管理工作与航空公司在航班数量、航班密度和时间编排上存在直接联系,而管制员与航空系统间的通话将成为有效衔接各个环节的重要任务之一,其内容也直接决定了空管工作运转的效率与安全。在通话过程中,管制员与飞机间所发生的通话信息均由管制终端将音频信号传至管制席位中的语音通话设备,其中管制指令音长约300~500 kHz,飞机语音指令音长约1000~2000 kHz。但在某些特殊天气情况下对话内容更会出现通话信息与管制指令音长不一致的情况,这就是空管工作中经常遇到的“飞机距离机场过远”或“管制任务过重”等问题。对于我国民航来说,由于存在不同的机场和地区而导致出现不同程度的空管通话信息,这将使其存在较大的安全风险,由此将使其成为一个亟待解决的关键技术问题。

4 空管系统对语音数据的需求

目前,随着我国民航事业的快速发展,航空公司运营航空运输和空中交通管理工作逐步增加。随着我国航路面积的快速扩大,民航空管系统对民航语音通话的要求也随之不断提升。尤其在低空空域条件下民航飞机与地面空中交通流量的不断增加,空管指挥人员将需要通过无线电设备与地面管制人员保持实时通话交流,以实时监控和管理空中交通流量。由于大量航空器同时从不同机场和地区入境所导致不同机场之间航班运行频率和时间存在一定差异,由此将直接影响空中交通效率和飞行安全,由此强化对语音数据的有效管理和应用将具有必要性。

5 基于语音识别的管制语音通话分析技术

在对空中交通监控进行实时分析时,一般需要针对语音通话进行数据的采集和分析。目前多数采用的手段是对通话录音进行预处理,并根据声音的强弱程度对原始录音资料进行分类,以便于系统识别。但此类措施需要人工识别过程时所产生的工作强度大、耗时长,且无法达到系统自动化程度。针对这一问题,以下将对基于语音识别的管制语音通话分析技术进行研究。

5.1 利用深度学习技术实现监控语音通话分析

深度学习技术在语音处理方法应用上具有良好的效果,而其中的神经网络也将使得语音通话的识别和分析效果能够得到优化提升。神经网络采用深度学习技术,训练时用较少资源即可获得高精度样本数据,训练好的神经网络可以识别更多更复杂的词汇,因此,利用神经网络进行监控语音通话分析具有很高的实际应用价值。从整体的角度来看,语音识别模型一般采用基于神经网络的语音训练方式,训练过程中需要对语音信号进行编码、语音识别并经过预分块,然后再利用神经网络算法对语音识别结果进行归类,而后再通过人工神经网络将归类结果进行分块,最后再对数据进行清洗和结果评价。而深度学习算法通过建立模型对语音识别结果进行学习和训练,最终实现在自动化程度较高和耗费时间较少的情况下监控语音通话分析效果提升,同时还可以利用深度学习算法对管制人员进行语音识别实验,由此使得研究成果能够对提升空管指挥工作质量发挥重要价值。

5.2 基于 GDT平台实现监控语音通话分析

GDT是以海量数据为基础的大规模分布式计算平台,其能够利用传统处理软件技术无法解决的难题实现各种复杂计算任务,主要包括对海量数据进行清洗、转换、运算和存储等功能,同时还可以实现从语音识别到自动查询等应用领域的分析处理。GDT的最大优势在于速度快,运行环境成熟稳定,并且其还能够在较短时间内对海量数据进行处理与分析。其缺点就是存在运算复杂度高、运行维护难度大两大问题;而基于大数据计算的监控语音通话分析系统可利用云计算技术进行云存储,且将云存储作为 GDT平台的核心技术之一。由于GDT平台具有高效可靠的高性能计算功能,而且该平台目前已被国内外一些知名空管应用中心采用。

5.3 特征提取与模型训练分析

语音识别的关键是特征提取和模型训练,其将直接影响到语音指令到文本的正确与否。语音数据包括声音和标记文本,其中音频部分是以频谱格式输入到模型,标记文本部分根据具体词典将其转化为相应的数字序列,作为所需输出值。该方法利用高级的深度卷积神经网络技术对语音进行识别,并将其转换成文本序列。同时也可以利用多层次的非线性结构,把低级特征转化为较高层次的抽象特征,而后以有监督或者无监督的方式对输入特征进行变换,由此使得语音识别和预测的精确度能够得到有效提升。除此之外,针对大量的语音数据进行特征训练,也可以从分布式网络结构和高性能的硬件加速训练两方面着手,以改善其训练效果。在训练集合中,随机选取几条有标记的语音,而后将其引入到模型中,并对其进行训练和数据更新,由此将能够有效提升语音识别的精准性。

结束语

总而言之,随着我国民航事业的快速发展,通过使用语音识别技术,管制部门能够有效提高对管制信息的管理效率。通过对管制员之间相关语音信息的提取、语音识别、文本合成、数据分析和语音识别系统的集成等技术研究以及应用,能够有效降低驾驶员与管制员之间沟通成本,提高运行效率,由此对基于语音识别的管制语音通话分析技术展开研究,其整体的应用价值是十分巨大的。

参考文献

[1]段昌淼.基于管制语音识别的数字化监测技术研究与应用[J].网络安全和信息化,2022,(10):82-85.

[2]田军,呼木吉勒.管制指令语音识别技术应用之我见[J].民航管理,2021,(04):84-86.

[3]侯勇,王铮,舒乔晔,傅山.一种防范电网调度员语音失误的语音辅助系统[J].微型电脑应用,2019,35(12):19-22.