2016-07-15 30 views
2

我想在汽车环境中通过语音分离提高语音识别的准确性。要处理的声音是一个挑战,因为噪音,无线电音乐和其他演讲者的声音可能总是混在一起。使用FASST语音分离

所以我想把声音分成两个部分,一个是我的声音,另一个是定义的一般噪音。为此,我通过HTK训练一个与扬声器相关的GMM模块(只是我的声音),然后使用FASST分离这些声音。你认为这会起作用吗?

回答

1

对于NMF,我会改用openblissart。另一个好主意是如果你还没有这样做,立体声录音。

您可以从切换到DNN模型而非HMM和Kaldi获得最大的改善,远远超过您从任何源分离中获得的。借助DNN,您还可以进行多层次训练,它的表现甚至会比噪音分离更好。您可以检查Kaldi源中的CHIME实验设置,以了解如何训练噪声鲁棒识别器。