2012-08-04 47 views
1

发送音频时没有给出正确的结果我偶然发现了文章Google Speech API,该文章提出了一种通过Perl从音频文件中提取文本的机制。现在我录制了一个音频文件,您可以在http://vocaroo.com/i/s0lPN5d3YQJj找到。这是一段简单的音频,阅读我爱你。当我使用Chrome浏览器中的Google语音API并说出这些字词时,我会得到正确的结果。当我在上面提到的与我指出的音频文件的链接中尝试代码时,它会返回奇怪的结果,如logan。我怎样才能让它更准确?这只是一个示例音频,我通常在做的是使用类似ffmpeg -i input.avi -vn -ar 44100 -ac 2 -ab 192 -f mp3 output.mp3的FFMpeg从视频文件中提取音频,然后是ffmpeg -i input.mp3 output.flacGoogle Speech API在文件

回答

2

您是否尝试过播放您创建的音频文件?

您正在设置192比特/秒的音频比特率,这个比例非常低。

对于192Kbps,您需要-ab 196608

+0

'-ab 196608'或'-ar 196608'? – SexyBeast 2012-08-04 19:06:26

+0

你听到了音频,对吧?这听起来相当不错,API为什么不选择呢? – SexyBeast 2012-08-04 19:07:27

+1

你想要'-ab 196608'。 '-ar'是在44.1KHz处很好的采样率。如果这是你发布的FLAC文件,那么我的猜测是谷歌正在用你的东方口音努力 – Borodin 2012-08-04 19:42:46

相关问题