2012-12-04 182 views
0

我正在研究嵌入式设备语音相关语音识别解决方案的解决方案。我曾经看过pocketsphinx,但因为我还不熟悉它,所以我认为也许有人更有经验可能知道。是否有可能使用pocketsphinx来实现这样的语音识别。而不是使用声学和语言模型,它应该记录音频,提取其特征,然后将其与任何所说的内容进行匹配。是否有可能使用pocketsphinx来实现这个流程?如果不是这样的解决方案,有人能指出我的正确方向吗? 谢谢。语音相关语音识别

回答

1

是否有可能使用pocketsphinx来实现这样的语音识别。

有一个在pocketsphinx API没有这样的功能

你可以做的是使用sphinxbase首先提取MFC系数,例如参见sphinx_fe源。

然后你可以应用DTW算法来比较记录。 DTW实现非常简单,它只是50行代码:

http://en.wikipedia.org/wiki/Dynamic_time_warping

有其实现DTW以及一些库,你可以找到维基百科页面上的链接。

很高兴看到一个演示DTW实施的pocketsphinx补丁。