简介:人的那个听觉的系统有自动语音识别ASR系统斜面火柴,和部分Fourier变换FrFT在非静止的信号处理有唯一的优点的优秀性能,是众所周知的。在这份报纸,Gammatonefilterbank为前端被用于讲话信号时间的过滤,然后产量subband信号的声学的特征基于部分Fourier被提取变换。就为FrFT的变换顺序的批评效果而言,一个顺序改编方法基于即时频率被建议,并且它的表演基于歧义功能与方法相比。ASR实验在干净、吵闹的Putonghua位上被进行,并且结果证明建议特征基于即时频率比MFCC基线,和顺序改编方法完成显著地更高的识别率基于歧义比那有低得多的复杂性函数。进一步更,基于FrFT的特征用建议顺序改编方法完成最高的识别率。
简介:为了由于不同扬声器,的改变的特征在语音识别减少降级,感性的频率为扬声器正规化基于subglottal回声变弯的一个方法被建议。变弯的因素用在subglottis和元音的道之间的声学的联合从第二subglottal回声被提取。第二subglottal回声独立于讲话内容,它多于第三共振峰反映说话者特征。感性的最小的变化无失真的反应PMVDR系数被使正常化,它是更柔韧的并且比MFCC有更好的反噪音能力。规范的系数在训练的讲话模式和语音识别被使用。实验证明词错误评价,作为与由第三共振峰变弯的MFCC和光谱相比,在吵闹的环境分别地在干净语音识别分别地在4%和3%,并且在9%和5%减少。结果显示建议方法能在一个说话者无关的识别系统改进词识别精确性。
简介: