基于汉语普通话共振峰参数的腭裂高鼻音自动识别研究

(整期优先)网络出版时间:2020-12-20
/ 1
摘要目的探讨提取腭裂语音中过高鼻音特征性共振峰参数建立的级联声道模型和小波包变换结合线性预测系数(LPC)2种算法模型,在识别腭裂患者高鼻音中的应用效果。方法选取2015年10月至2018年12月,在四川大学华西口腔医院语音矫治专科就诊的859例腭裂患者,其中男421例,女438例,平均年龄12.1岁。正常语音216例,轻度高鼻音220例,中度高鼻音213例,重度高鼻音210例。按照汉语普通话测试工具收集包括词组、短句的语音样本共62 707份。运用级联声道模型、小波包变换结合LPC的语音信号识别方法提取共振峰参数,采用K近邻分类器,对数据进行分类,判别有无过高鼻音及具体等级。将2种算法模型的分类结果与人工语音评估金标准结果进行对比,运用卡方检验分析其准确性。结果级联声道模型和小波包变换结合LPC提取共振峰参数这2种方法判断高鼻音有无的正确率分别为80.56%(692/859)和89.99%(773/859),对高鼻音等级判断的总正确率为72.29%(621/859)和88.13%(757/859),差异均具有统计学意义(P<0.05)。2种算法对每个高鼻音等级自动判别的正确率均为小波包变换结合LPC优于级联声道模型,且差异具有统计学意义(P<0.05)。2种方法对高鼻音等级类别的识别错误类型中,最严重的错误均为将正常语音判断为轻度高鼻音,小波包变换结合LPC法与级联声道模型分别达到了18.98%(41/216)与14.81%(32/216),但前者的其余错误率均在5%以下,优于后者。结论小波包变换结合LPC的算法与级联声道模型相比,在判断腭裂患者高鼻音有无及等级方面正确率更高,可辅助人工语音师对腭裂患者的语音评估。