2012-10-30 110 views
3

我知道“x-webkit-speech”能够做某种形式的语音识别,实际上它的识别效果非常好。用于连续语音识别的HTML5语音输入API

我发现“x-webkit-speech”适用于开发Q &应用程序,您只需提问并且系统能够识别问题并回答您。

但是,我正在寻找的是一种在浏览器中执行连续语音识别的方法。例如,如果我正在网上听讲座,我想转录教授正在谈论的实时内容。

“x-webkit-speech”有可能吗?我的感觉是,“x-webkit-speech”会在检测到一个很短暂的沉默期时自动停止,这很烦人。我知道它实际上将音频转换成flac并将其发送回谷歌服务器。是否有可能发回更长的音频?我需要网络上的连续语音识别。

回答