我正在使用传统过程执行单词识别。 我正在提取MFCC功能。然后我创建一个代码簿以进行矢量量化。之后,我训练离散HMM两个单词:1stWrod,2dWord。语音识别,字典中的单词
到目前为止,我一直在执行这样的分类: 我估计了新的音频段的两个训练模型中具有适当特征提取和量化的概率。我说音频对应的概率最高的类。这给了我很好的结果。
但是任何音频片段都被归类为这些词中的任何一个,有时不是。我不知道怎么说这不对应任何阶级。我不确定我是否可以通过训练其他所有数据的模型来解决这个问题,因为它非常不同,我认为这个模型还不够。
我做了你告诉我的,但出于任何原因,一些声音给予了,并且不要让我有意思。我正在使用Kevin Murphy Library for MATLAB,但这也发生在MATLAB中的内置函数中。 – jessica
如果对数似然变为-Inf,则意味着您在创建特征向量的过程中遇到了问题。这意味着您当前使用的模型根本不匹配数据。检查原始音频文件是否有问题(编码错误,采样率错误等),并仔细检查如何执行特征提取。 – lCapp