语音相关语音识别

我正在研究嵌入式设备语音相关语音识别解决方案的解决方案。我曾经看过pocketsphinx，但因为我还不熟悉它，所以我认为也许有人更有经验可能知道。是否有可能使用pocketsphinx来实现这样的语音识别。而不是使用声学和语言模型，它应该记录音频，提取其特征，然后将其与任何所说的内容进行匹配。是否有可能使用pocketsphinx来实现这个流程？如果不是这样的解决方案，有人能指出我的正确方向吗？谢谢。语音相关语音识别

来源

2012-12-04 Ray

是否有可能使用pocketsphinx来实现这样的语音识别。

有一个在pocketsphinx API没有这样的功能

你可以做的是使用sphinxbase首先提取MFC系数，例如参见sphinx_fe源。

然后你可以应用DTW算法来比较记录。 DTW实现非常简单，它只是50行代码：

http://en.wikipedia.org/wiki/Dynamic_time_warping

有其实现DTW以及一些库，你可以找到维基百科页面上的链接。

很高兴看到一个演示DTW实施的pocketsphinx补丁。

来源

2012-12-05 07:51:48

语音相关语音识别

回答

相关问题