2012-10-04 124 views
25

我现在正在与我的项目合作,我即将为桌面计算机构建一个类似Siri的应用程序。我在考虑Google语音API是否可靠且准确地进行语音识别?你能告诉我什么语音API在语音识别方面最准确吗?最优选的是免费的API。谢谢。谷歌语音API

+0

您可能需要考虑运行您自己的语音识别器。 CMU Sphinx提供了特定的声学模型并为在移动设备中使用构建了说明http://cmusphinx.sourceforge.net/wiki/building –

回答

36

虽然Google语音API是免费的,但它不是官方的公共API。有些人已经对其进行了逆向设计,如discussed in this blog。如果您打算直接访问API以获得商业产品,我不会推荐它,因为他们可以放弃它或在没有警告的情况下进行更改,从而打破您的产品。最近发生在使用Google Weather API的开发者身上。如果您通过Chrome浏览器使用x-webkit-speech访问它,则可能是安全的,因为它受Google支持。谷歌的语音识别功能与许多更受欢迎的商业解决方案一致。他们在Google Voice等其他项目以及现已停用的Google 411中拥有丰富的经验。他们有一些顶尖的语音科学家为他们工作。我唯一能想到的另一个免费替代方案是Sphinx这是一个卡内基梅隆大学开源项目。使用这种解决方案的学习曲线陡峭,如果您希望将其设置为服务,您将不得不自己开发。 Nuance是语音识别市场的另一个重要参与者(我相信这是Siri使用的),他们确实有提供语音识别服务的解决方案。但它们很昂贵。在回答评论

更新的语言支持

Windows语音识别支持其他语言一样,大多数语音识别系统。但是要注意的是,你必须告诉系统使用什么语言,并且必须支持有问题的语言。每个供应商都有一个它支持的语言列表,它们是特定于某个地区的。例如,供应商可能支持墨西哥西班牙语,美国西班牙语和西班牙西班牙语;所有的方言都略有不同。但语音识别引擎只能在每个用户的计时器上支持一种语言/方言。用户不能先向语音识别系统讲多种语言,而不先请求它改变为该语言。

更新2014年3月17日

的x WebKit的语音输入字段已被弃用,由于缺乏在其他浏览器的支持。这将被替换为Web Speech API,这是一个javascript API。你可以找到一个example on how to use it here

+0

我与Google在Google API上完全达成了协议。由于该问题是针对桌面应用的,因此我只需添加一条建议。 Windows为其桌面和服务器操作系统提供免费的语音识别功能。有关更多信息,请参阅http://stackoverflow.com/questions/4213035/sapi-and-windows-7-problem和http://stackoverflow.com/a/6351055/90236。 –

+0

我在Windows语音识别的准确性方面遇到了麻烦,也许是因为它需要用英语说话。我也想知道哪些API在语音识别方面最准确,并且还会采用其他语言。感谢您迈克尔•勒维和凯文•琼汉斯。 –

+1

非常感谢您的回应,先生。我现在将这个Google语音API用于我的项目。关于它的准确性好,但也许我可以在下次改变它,如果一些语音API的提供更多的准确性比这取决于我将使用它的项目。谢谢你.. –