我现在正在与我的项目合作,我即将为桌面计算机构建一个类似Siri的应用程序。我在考虑Google语音API是否可靠且准确地进行语音识别?你能告诉我什么语音API在语音识别方面最准确吗?最优选的是免费的API。谢谢。谷歌语音API
谷歌语音API
回答
虽然Google语音API是免费的,但它不是官方的公共API。有些人已经对其进行了逆向设计,如discussed in this blog。如果您打算直接访问API以获得商业产品,我不会推荐它,因为他们可以放弃它或在没有警告的情况下进行更改,从而打破您的产品。最近发生在使用Google Weather API的开发者身上。如果您通过Chrome浏览器使用x-webkit-speech访问它,则可能是安全的,因为它受Google支持。谷歌的语音识别功能与许多更受欢迎的商业解决方案一致。他们在Google Voice等其他项目以及现已停用的Google 411中拥有丰富的经验。他们有一些顶尖的语音科学家为他们工作。我唯一能想到的另一个免费替代方案是Sphinx这是一个卡内基梅隆大学开源项目。使用这种解决方案的学习曲线陡峭,如果您希望将其设置为服务,您将不得不自己开发。 Nuance是语音识别市场的另一个重要参与者(我相信这是Siri使用的),他们确实有提供语音识别服务的解决方案。但它们很昂贵。在回答评论
更新的语言支持
Windows语音识别支持其他语言一样,大多数语音识别系统。但是要注意的是,你必须告诉系统使用什么语言,并且必须支持有问题的语言。每个供应商都有一个它支持的语言列表,它们是特定于某个地区的。例如,供应商可能支持墨西哥西班牙语,美国西班牙语和西班牙西班牙语;所有的方言都略有不同。但语音识别引擎只能在每个用户的计时器上支持一种语言/方言。用户不能先向语音识别系统讲多种语言,而不先请求它改变为该语言。
更新2014年3月17日
的x WebKit的语音输入字段已被弃用,由于缺乏在其他浏览器的支持。这将被替换为Web Speech API,这是一个javascript API。你可以找到一个example on how to use it here。
我与Google在Google API上完全达成了协议。由于该问题是针对桌面应用的,因此我只需添加一条建议。 Windows为其桌面和服务器操作系统提供免费的语音识别功能。有关更多信息,请参阅http://stackoverflow.com/questions/4213035/sapi-and-windows-7-problem和http://stackoverflow.com/a/6351055/90236。 –
我在Windows语音识别的准确性方面遇到了麻烦,也许是因为它需要用英语说话。我也想知道哪些API在语音识别方面最准确,并且还会采用其他语言。感谢您迈克尔•勒维和凯文•琼汉斯。 –
非常感谢您的回应,先生。我现在将这个Google语音API用于我的项目。关于它的准确性好,但也许我可以在下次改变它,如果一些语音API的提供更多的准确性比这取决于我将使用它的项目。谢谢你.. –
- 1. 谷歌语音API调用
- 2. 关于谷歌语音API
- 3. 谷歌语音API和网络语音API的区别
- 4. Pocketsphinx VS谷歌的语音识别API
- 5. 谷歌语音识别库或API
- 6. 网络语音API在谷歌浏览
- 7. 谷歌语音识别api - 坏请求
- 8. 解析SMSThread谷歌语音的Java API
- 9. 未能执行谷歌云语音API
- 10. 谷歌文本到语音API
- 11. 谷歌语音API无效识别
- 12. 谷歌云语音API:通过REST
- 13. 谷歌语音api空的结果JSON
- 14. 如何使用谷歌云语音API
- 15. 谷歌语音API仍然支持?
- 16. 谷歌的语音识别API
- 17. 谷歌云语音API增加语音上下文
- 18. 谷歌语音API中口语的语言代码检测
- 19. 谷歌云语音API:Nodejs
- 20. 谷歌语音从通知
- 21. 谷歌语音PHP OAuth 2.0
- 22. 谷歌语音API抛出无效音频通道数
- 23. 谷歌语音API - 识别base64编码音频
- 24. 谷歌语音识别API几秒钟后停止录音
- 25. Phonegap android和iPhone - 谷歌地图api v3与导航语音api
- 26. 谷歌Oauth2与谷歌语音API服务帐户rpc不起作用
- 27. 谷歌云API语法
- 28. 使用谷歌语音到文本API时出现400错误
- 29. 如何增加谷歌语音API查询请求超过50
- 30. PHP - 谷歌语音API:未找到'Google \ Cloud \ Speech \ SpeechClient'类
您可能需要考虑运行您自己的语音识别器。 CMU Sphinx提供了特定的声学模型并为在移动设备中使用构建了说明http://cmusphinx.sourceforge.net/wiki/building –