在android语音输入识别器中预处理音频

我正在做一些基本的命令识别并使用Google Search Input API。但是我想自己捕捉音频，预处理音频（去噪，提升幅度等），将这些修改过的音频发送给识别器并获取结果。可能吗？在android语音输入识别器中预处理音频

我知道你可以使用SpeechRecognizer和RecognitionListener来使用onBufferReceived方法获得音频。但是我想做预处理而不是后处理。是否有任何解决方法/黑客来处理谷歌识别器处理的数据？

2012-05-13 pzo

预处理音频（降噪，提升幅度等），发送这些修改后的音频到识别和获取结果

一般的语音识别系统，从这个苦。不正确地执行去噪会降低语音识别的准确性，因为它会以不可预测的方式破坏频谱。幅度提升无助于因为幅度在语音识别的最初阶段被归一化。你的预处理只能伤害。

如果你仍然想尝试一下，尝试pocketsphinx

2012-05-15 05:16:38

THX的关于与降噪陷阱尖端。我已经测试过狮身人面像，但它提供的应用程序真的很差，所以我想使用谷歌识别器。是逆向工程android识别器活动做预处理的唯一方法呢？ – pzo

回答