2009-07-13 108 views
6

我需要开发一个识别语音的iPhone应用程序,并根据结果执行进一步的任务。iPhone上的语音识别

我知道iPhone 3.0不支持语音识别,我需要在服务器端实现语音识别软件。我只知道这件事,因为我是新手,我不知道该如何处理。

意思我需要在服务器端购买和实现它的软件以及如何使用该服务?

+0

你是什么意思服务器端? – Shimmy 2009-07-13 09:23:13

+1

他的意思是“不在电话里”。这可能有助于指定是否需要使用特定的服务器操作系统。 – 2009-07-13 09:36:06

+0

服务器端意味着将音频数据发送到服务器,识别那里的语音(使用大量资源和内存)并将生成的文本输出发送回手机。谷歌在Android上使用OCR和机器翻译来做到这一点,例如:拍摄一些外文文件,将其发送到服务器,OCR并将其翻译成英文,并将文本结果发回。 – Frank 2010-04-11 17:14:23

回答

7

我知道的最好的开源语音识别软件包是Sphinx。
http://cmusphinx.sourceforge.net/

否则,我会建议调查Nuance软件。

当前的语音识别功能在语法设置有限的情况下表现良好(如果您知道他们将会说些什么)。开放式听写仍然不能很好地适用于许多应用程序。请在开发应用程序时牢记这一点。我希望现在谷歌正在进入转录游戏(使用谷歌语音),这应该开始改善。我想他们将来可能会有一些东西。

1

获得语音识别的权利是非常棘手和积极的研究领域。

虽然有几个开源解决方案,但请参见here。另一个新的是SCARF,但我不知道这是否可以使用,或者只是一个概念证明。