2013-06-05 44 views
-3

我想要具有训练好的平台即语音模块的自动语音识别器。 对于例如: - 我有两个词非常相似,所以系统必须听到compplete词和任何dilax并验证它并给出输出。具有预训练数据集的自动语音识别器

如何做到这一点。

我已经搜索过,但我完全空白在这一点上。

回答

0

您想使用哪种技术?这里有不同的框架,例如.net项目的Dragonfly框架(https://code.google.com/p/dragonfly)或System.Speech.Recognition命名空间。对于移动设备,您可以仔细查看Google提供的语音识别API。

+0

我想它在移动设备,我已经在Adnroid内实现语音识别,但现在我想定义自己的库+我要像人发音不同的方式的话,所以我想reconize这一点,使输出 –

+0

我有PocketSpinx,但我不知道android ndk正在使用和所有..!1 –

0

从这个角度来看,使用Android语音识别API进行微调是不可能的。 你可能需要从头开始做这件事..

如果你想继续使用谷歌语音识别API,那么你需要做后处理...这称为NLU(自然语言理解)或NLP(自然语言理解)自然语言处理)。

简单的概念是什么STT(语音到文本)结果来自谷歌API,你需要将它们分组成一个最终的输出。你有什么不同的口音或语调成为一个。或者当这个过程需要一些内容来理解并采取一些行动,比如首尔的天气时,这个过程是否有价值?

回到你的问题,微调区分相似发音词需要有AM(声学模型)和LM(语言模型)训练出来的各种词汇相应地设置。因此,您需要从零开始训练模型或使用具有声学模型适应的现有模型也可以。

与开源的良好开端是HTK或狮身人面像。如果你有购买预算,那么T's watson是迄今为止语音识别领域的最佳工具。

0

我认为你应该采取一种不同的方法,比试图让狮身人面像工作更简单。

使用像soundEx这样的语音匹配算法来查找用户是否更倾向于说出一个单词或其他单词。我会修改soundEx算法,以便更容易匹配字符串。如果你的话足够不同,它应该做得很好。

Here is some code to do it