首页 / 科技百科 / 正文

语音识别基本法 

语音识别的基本方法主要有两种:

1. 基于语音学和声学的方法:这种方法认为常用语言中有有限个不同的语音基元,可以通过其语音信号的频域或时域特性来区分。实现过程分为两步:第一步是分段和标号,即把语音信号按时间分成离散的段,每段对应一个或几个语音基元的声学特性,然后根据相应声学特性对每个分段给出相近的语音标号。第二步是得到词序列,根据第一步所得语音标号序列得到一个语音基元网格,从词典得到有效的词序列,也可结合句子的文法和语义同时进行。

2. 模板匹配的方法:这种方法已经发展比较成熟,达到了实用阶段。在模板匹配方法中,要经过四个步骤:特征提取、模板训练、模板分类、判决。常用的技术有动态时间规整(DTW)、隐马尔可夫(HMM)理论、矢量量化(VQ)技术。其中,HMM方法是语音识别的主流技术,它对语音信号的时间序列结构建立统计模型,将之看作一个数学上的双重随机过程,合理地模仿了人的言语过程,很好地描述了语音信号的整体非平稳性和局部平稳性。

如有侵权请及时联系我们处理,转载请注明出处来自