2012-05-13 57 views
0

我正在做一些基本的命令识别并使用Google Search Input API。但是我想自己捕捉音频,预处理音频(去噪,提升幅度等),将这些修改过的音频发送给识别器并获取结果。可能吗?在android语音输入识别器中预处理音频

我知道你可以使用SpeechRecognizerRecognitionListener来使用onBufferReceived方法获得音频。但是我想做预处理而不是后处理。是否有任何解决方法/黑客来处理谷歌识别器处理的数据?

回答

0

预处理音频(降噪,提升幅度等),发送这些修改后的音频到识别和获取结果

一般的语音识别系统,从这个苦。不正确地执行去噪会降低语音识别的准确性,因为它会以不可预测的方式破坏频谱。幅度提升无助于因为幅度在语音识别的最初阶段被归一化。你的预处理只能伤害。

如果你仍然想尝试一下,尝试pocketsphinx

http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/

+0

THX的关于与降噪陷阱尖端。我已经测试过狮身人面像,但它提供的应用程序真的很差,所以我想使用谷歌识别器。是逆向工程android识别器活动做预处理的唯一方法呢? – pzo