1

我正在为Google Glass编写游戏,但不幸的是,SpeechRecognizer API在Google Glass GDK的当前版本中不可用。用于非常简单的语音/语音识别的算法

所以我一直在考虑实现一个非常简单的语音识别算法。 假设我只想识别:“是”和“否”。
你知道任何示例代码或任何有用的资源来帮助我实现这个吗?
难道我不应该放弃这个想法,并使用CMUSphinx这样的大型框架吗?

如何识别:上,下,右,左或从1到10的数字?

+0

通常,您使用隐马尔可夫模型(HMM)训练语音识别。 – Regenschein

回答

6

据我所知,经常使用fast Fourier transform (FFT)转换到频域并进行分析。还需要一些用于频率关联的演讲词典。

请参阅此链接:

CMU Sphinx有Java实现。

David Wagner有很好的文章和matlab实现。

P.S.哦,如果你用俄语说话,你为什么不读this文章 - 很简单,用java的例子。

P.P.S.老实说,我从来没有使用过这个框架,但是如果你对语音识别只有肤浅的认识,那么强健和容易的方法就是使用现有的完整解决方案,比如框架或者库,否则你需要花时间去掌握必要的知识门槛。在这种情况下,您可以阅读this文章。

+0

看起来像PocketSphinx(CMU狮身人面像的一部分)是要走的路。 –