2016-12-06 31 views
0

我使用HTK来训练声学模型。我最后一步是分裂电话gaussians的混合物。通常,我总是将所有电话(它们的内部状态)一步一步分开,然后在性能下降时重新评估并停止。HTK:通过电话优化混合分离手机

现在我想通过一个尝试拆分手机之一,因为这应导致同等或更好的整体效果。我这样做的方式是,尝试拆分每部手机,选择能够带来最佳结果的手机,保持分离,重新设置所有其他手机,然后重新开始。这需要很长的时间。我想把所有那些带来改进的不仅仅是最好的分开,然后进行下一次迭代。

我的问题是:如果拆分手机降低了性能,有没有在后面的阶段试图再次分裂的任何一点?或者我可以将它列入黑名单,然后尝试那些在最后一次迭代中带来改进的项目?

回答

1

这种方案的改进通常很小。简单地转向DNN(顺便支持HTK 3.5)可以获得更好的改进。

如果拆分手机会降低性能,那么在后期尝试再次拆分手机是否有意义?或者我可以将它列入黑名单,然后尝试那些在最后一次迭代中带来改进的项目?

你可以黑名单

+0

谢谢!我不知道HTK 3.5运动神经网络!你知道我需要多少训练数据吗?我有大约66个小时的训练数据。它适用于总计1000小时左右的一位发言者的数据集。顺便说一句,你不能黑名单。分裂'b'在第一次迭代中导致更差的性能,但是在第二次迭代中更好。 – Sixtease