基于自然语言处理的电力调度语音识别方法

(整期优先)网络出版时间:2023-07-28
/ 2

基于自然语言处理的电力调度语音识别方法

张富城 ,宋如梦

安徽新华学院  安徽省合肥市望江西路555号 邮编230000

摘要:随着中国“碳达峰”“碳中和”目标的提出,政府能源监管部门要求进一步降低燃煤火电的发电比例,提高新能源发电比例。为此,国家从政策上大力扶持光伏、风电等新能源发电站建设,新能源发电站数量增长迅猛。电网公司按照电网规模配置调度值班人员,仅满足传统的发电站调度需求。在大量的新能源发电站接入电网后,电力调度值班人员存在的语音交流处理能力不足的问题,严重影响了电力调度的效率。

关键词:自然语言处理;电力调度

1 电力调度语音识别框架

本文所述的基于自然语言处理的电力调度语音识别方法框架组主要包括提取电力调度语音特征、语音特征信息预处理、提取语音文本词袋信息、上下文语义关联分析和获取调度语音文本信息五部分内容。

在电力调度语音特征环节,针对电力调度中存在的方言情况,采用动态时间规整算法提取新能源场站调度语音中的特征信息,获取方言中的关键点。在语音特征信息预处理环节,通过自然语言处理方法对调度语音特征信息进行降维处理,从而降低高维语音空间识别难度。在提取语音文本词袋信息环节,将电力调度语音的词汇形成专用词袋,将电力调度语音中的信息和词袋信息进行关联分析,获取该语音的词袋所属特征。

2 电力调度语音识别建模

2.1 提取电力调度语音特征

动态时间归整(DTW)算法是一种在时间域拉伸或压缩的算法,可有效解决不同人员在发同一音时的时间长短不一致问题。本文采用DTW方法,将电力调度语音发音时间轴调整一致,并提取语音的特征信息。

设电力调度语音输入的2个语音时间序列分别为J和K,2个语音的时间轴长度为IMG_257IMG_258,规整的路径有m个,时间规整的取值范围为

设语音的时间坐标为x,强度坐标为y,动态规整路径为Ra,最佳的规整路径R(x,y)为

通过时间规整后,可获得电力调度语音中的特征信息。

2.2 语音特征信息预处理

语音特征信息预处理环节中,自然语言处理(NLP)是运用计算机技术与人类语言通信的有效方法,可以广泛的应用于电力调度的语音识别预处理环节。

本文通过自然语言处理方法对调度语音特征信息进行降维处理,从而降低高维语音空间识别难度。设电力调度时间规整后的语音数据维度为na个,样本数量为ma个,时间规整后的语音序列为la,降维后的数据为:

通过数据降维,可以降低高维语音空间识别难度。

2.3 提取语音文本词袋信息

文本词袋模型是将电力调度的专用词语装进专用文本词语集合,同时,将后续的电力调度语音与电力调度专用文本词袋进行关联分析,获取当前电力调度语音的词袋所属特性。

按照电力调度语音样本大小划分为s个簇,簇心为O,向量值为U,电力调度语音文本词袋质心Pt为

电力调度语音文本词袋质心即为词袋所属特性。

2.4 获取调度语音文本信息

获取调度语音文本信息环节,在进行上下文本关键分析后,可获得准确的电力调度语音信息。然后直接将电力调度语音转换为电力调度文本信息,供电力调度模型或人员分析使用。

3 电力调度语音识别仿真流程

步骤1:提取新能源场站调度语音中的特征信息,获取方言中的关键点。

步骤2:对调度语音特征信息进行降维处理,从而降低高维语音空间识别难度。

步骤3:将电力调度语音中的信息和词袋信息进行关联分析,获取该语音的词袋所属特征。

步骤4:将电力调度语音中的上下文本进行关联分析,判断该文本的含义是否正确。

步骤5:将上下文语义关联分析后的电力调度语音转换为电力调度文本信息。

4 算例分析

为验证本文所提基于自然语言处理的电力调度语音识别方法的有效性,在某省电力调度中心新能源场站调度中进行了验证,本文所提方法采用的系统环境为Win 10,处理器Intel 4核2.5 G,内存为16 GB,仿真软件采用MATLAB2018。

电力调度的语音数据选择为2020年某省电力调度员向新能源场站下达的13 746条调度口令数据,其中1 min以内的电力调度语音数据为2624条,1~2 min的电力调度语音数据为5275条,2 min以上的电力调度语音数据为5847条,本文的语音降维选择4维。

本文用于对比分析的隐马尔科夫模型是一种电力调度语音识别的常用模型,采用从左到右单向的建模,通过连续语音的音素分析来进行电力调度语音识别。隐马尔科夫模型在业界广泛使用,因此,采用隐马尔科夫模型与本文所提方法进行对比分析。

(1) 电力语音特征样例分析

在某省电力调度的13 746条语音库中,首先从电力调度语音库中选取100条调度指令语音词语作为标准;然后,随机选取包含上述词语的1000条语音数据进行分析。设置条件为标准词语语长5%以内的为满足时间,低于5%的为语速过缓,高于5%的为语速过快,分析结果如表1所示。

表1 电力调度语音特征表


类别

语音数量


语速过缓

276


语速适中

157


语速过快

567

(2) 数据降维分析

为验证数据降维后,对电力调度语音识别影响,分别选取降维数量为2、4、6维数据,对比降维前后的电力调度语音数据信息损失量,对比结果如表2所示。

表2 数据降维表


维度数

语音信息损失/%


2

0.16


4

0.42


6

1.17

(3) 词袋信息提取

本文以“核对相序”为例,说明将获取该电力调度词袋库属性的过程。首先,获取电力调度语音样本库中簇的信息;然后,比对“核对相序”词语与电力调度语音样本库簇的特征,并将比对一致的特征作为样本库质心属性,包括:变电站母线相序、输电线路相序等。

(4) 上下文关联

本文以“送电,拆除接地线”为例,说明上下文关联的过程。首先,变电站在完成检修后,电力调度员下达“恢复供电”命令;然后再下达“拆除接地线”的命令。在上下文关联分析中,判断两条调度命令是否正确,若出现上文中的先送电再拆接地线的意思,将出现事故,所以上下文关联中,将判断是否存在逻辑错误。

(5) 电力调度语音识别性能分析

电力调度语音识别模型的运行时长是反映语音识别模块处理性能的核心指标。电力调度语音识别模型的识别时长越少,模型处理任务的能力也就越快。

选择电力调度的语音数据为10、20、50、100、200、300、500、1000条,采用本文所提基于自然语言处理的电力调度语音识别方法与隐马尔科夫模型对比处理时长,对比结果如表1所示。

表3 电力调度语音识别时长对比表


电力调度语音数量


语音识别模型运行时长/s


自然语音处理

隐马尔科夫


10

0.57

1.14


20

1.15

2.30


50

2.87

5.79


100

5.73

11.45


200

11.44

22.89


300

17.08

34.42


500

28.55

57.17


1000

57.03

114.26


单条语音平均时长

0.057

0.115

由表1可见,本文所提基于自然语言处理的电力调度语音识别方法在单条语言识别时长方面较隐马尔科夫模型短0.058 s。

(6) 电力调度语音识别准确率

电力调度语音识别准确率是语音识别模型的最重要技术指标。其计算方式是语音识别成功的数量与识别总数的比值,该值越大语音识别成功率就越高。

5 总结

为了解决新能源电站调度中存在的语音交流处理能力不足、语音识别准确率低的问题,本文提出了一种基于自然语言处理的电力虚拟调度方法。在对调度语音数据的时长进行动态规整并提取特征后,采用自然语言处理模型进行预处理,降低高维语音空间识别难度。在此基础上,通过对调度语音信息进行上下文关联分析,获得新能源场站调度语音的语音文本信息。最后,在某地区的新能源场站调度中应用本文所提方法,其应用结果验证了本文所提方法的有效性。

下一步,将结合电力调度语音识别结果,对自动下达调度命令方面做进一步研究。

参考文献

[1] 李俊峰.关于统筹实现碳达峰目标与碳中和愿景的几点建议[J].环境与可持续发展,2021,46(2):11-13.

[2] 倪禛霖,李延和,张红丽,等.全清洁能源发电转型过程中火电退出顺序评估[J].电网与清洁能源,2021,37(1):127-134.

[3] 李东东,郭天洋,刘庆飞,等.计及光伏发电的新能源电力系统惯量评估[J].太阳能学报,2021,42(5):174-179.

[4] 詹健.我国新能源发电信息化发展思路探析[J].大科技,2021(3):247-248.