使用FASST语音分离

我想在汽车环境中通过语音分离提高语音识别的准确性。要处理的声音是一个挑战，因为噪音，无线电音乐和其他演讲者的声音可能总是混在一起。使用FASST语音分离

所以我想把声音分成两个部分，一个是我的声音，另一个是定义的一般噪音。为此，我通过HTK训练一个与扬声器相关的GMM模块（只是我的声音），然后使用FASST分离这些声音。你认为这会起作用吗？

2016-07-15 li360buaa

对于NMF，我会改用openblissart。另一个好主意是如果你还没有这样做，立体声录音。

您可以从切换到DNN模型而非HMM和Kaldi获得最大的改善，远远超过您从任何源分离中获得的。借助DNN，您还可以进行多层次训练，它的表现甚至会比噪音分离更好。您可以检查Kaldi源中的CHIME实验设置，以了解如何训练噪声鲁棒识别器。

2016-07-15 14:40:43

回答