我有一个客户需要一个Android应用程序,可以识别口头命令。据我所知,内置的语音功能实际上是将数据发送给Google的服务器,然后发回文本翻译。这是一个主要问题,因为语音数据非常敏感(除非数据在发送到Google或从Google发送时加密 - 但我怀疑它是否加密)。CMU狮身人面像可以设置识别200字
有两个选项,我可以想到。首先是在Android上转换语音到文本,尽管这似乎是一个非常昂贵的操作。第二种可能是让本地服务器为我转换数据(我可以在发送和接收时加密语音数据和翻译)。这是什么CMU斯芬克斯可以拉开?值得一提的是,我也可以访问Asterisk服务器,这可能有助于解决这个问题(我不知道)。
实际上,应该只有~200字左右,需要被识别。我更喜欢开源/免费软件解决方案,但我也开放了商业解决方案(可能是FlexT9)。理想情况下,我可以将音频流发送到某处,取回一个字符串作为文本,然后我可以使用字符串解析并执行其他操作。
我过去没有做过多的android或任何语音识别开发,所以我希望有人能够至少指出我正确的方向。谢谢!
微软的解决方案是否可用于Android(您建议的那个)? – srf 2013-04-21 19:59:49
它只是一个服务器端组件。您必须构建自己的客户端实现来捕获音频并将其发送到服务器。 – 2013-04-21 21:38:13