基于动态时间规整(DTW)的孤立字语音识别

心中带点小风骚 • 2022年5月31日上午11:17 • 技术文章 • 阅读 223

模板匹配法语音识别系统

用户将词汇表中每个词依次说一遍，并且将其特征矢量时序作为模板存入模板库，在识别阶段，将输入语音的特征矢量时间序列依次与模板库中每个模板进行相识度比较，将相识度最高者作为识别的结果输出。

特征

使用MFCC系数以及一阶和二阶差分作为特征参数。MFCC是将人耳的听觉特征与语音参数相结合的一种特征参数。MFCC的计算可以参考3.4节。

动态时间规整（DTW）

在识别阶段的模式匹配中，不能简单地将输入模板与词库中模板相比较实现识别，因为语音信号具有相当大的随机性，这些差异不仅好酷哦音强的大小，频谱的偏移，还有发音持续时间不可能是完全相同的，而词库中模板不可能睡着模板输入持续时间的变换而进行伸缩，所以时间规整是不可少的。DTW是吧时间规整和距离测度计算结合起来的非线性规整技术，是模板匹配的方法。

假设某一参考模板的特征矢量为：基于动态时间规整(DTW)的孤立字语音识别

文章出处登录后可见！

已经登录？立即刷新

基于动态时间规整(DTW)的孤立字语音识别

模板匹配法语音识别系统

特征

动态时间规整（DTW）

相关推荐