基于动态时间规整(DTW)的孤立字语音识别

模板匹配法语音识别系统

用户将词汇表中每个词依次说一遍,并且将其特征矢量时序作为模板存入模板库,在识别阶段,将输入语音的特征矢量时间序列依次与模板库中每个模板进行相识度比较,将相识度最高者作为识别的结果输出。

特征

使用MFCC系数以及一阶和二阶差分作为特征参数。MFCC是将人耳的听觉特征与语音参数相结合的一种特征参数。MFCC的计算可以参考3.4节。

动态时间规整(DTW)

在识别阶段的模式匹配中,不能简单地将输入模板与词库中模板相比较实现识别,因为语音信号具有相当大的随机性,这些差异不仅好酷哦音强的大小,频谱的偏移,还有发音持续时间不可能是完全相同的,而词库中模板不可能睡着模板输入持续时间的变换而进行伸缩,所以时间规整是不可少的。DTW是吧时间规整和距离测度计算结合起来的非线性规整技术,是模板匹配的方法。

假设某一参考模板的特征矢量为:基于动态时间规整(DTW)的孤立字语音识别

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
上一篇 2022年5月31日 上午11:16
下一篇 2022年5月31日 上午11:18

相关推荐

本站注重文章个人版权,不会主动收集付费或者带有商业版权的文章,如果出现侵权情况只可能是作者后期更改了版权声明,如果出现这种情况请主动联系我们,我们看到会在第一时间删除!本站专注于人工智能高质量优质文章收集,方便各位学者快速找到学习资源,本站收集的文章都会附上文章出处,如果不愿意分享到本平台,我们会第一时间删除!