2011-07-21 43 views
3

我使用了需要字典的Openears。当我们在字典中提到这个词时它是有用的。我想转换我们说的所有单词。所以我用Nuance的演讲来认可dragaon SDK。但它与网络服务器通信。由于安全问题,我想避免服务器通信。是否有可能将语音转换为文本,因为它是在Windows Mobile中,而不是仅在离线模式下与服务器进行通信?iPhone中没有互联网的大词汇量语音识别?

回答

3

无限词汇表的语音识别需要非常大的计算和内存资源(千兆字节的内存),因此在其他嵌入式设备上的iPhone中很难做到这一点。 iPhone比桌面慢9倍。 iPad比较容易,因为它具有更强大的CPU。

谷歌已经付出了很大的努力,使他们的引擎脱机听写,并且仍然倾向于将数据发送到服务器,因为它显着更准确。

因为大多数在小设备上运行的解决方案都使用有限的词汇表。虽然这个词汇可能足够大,所以你不会注意到这一点。通常500-1000字足以覆盖大多数实际情况。你可以使用OpenEars来识别这些词汇。

要训练语言模型,您需要从您的域(单词和表达式)文本。在CMUSphinx tutorial中描述了语言模型培训。要使用的语言模型,你可以使用下面的OpenEars API调用:

- (void) changeLanguageModelToFile:  (NSString *) languageModelPathAsString 
withDictionary:  (NSString *) dictionaryPathAsString 

详情请参阅API reference

您可以使用OpenEars这样的词汇表和相应的语言模型来支持设备的自由格式文本输入。

+0

还相关http://stackoverflow.com/questions/25949295/cmusphinx-pocketsphinx-recognize-all-or-large-amount-of-english-words –

1

它可以做到,但如果你正在寻找一个无限的词汇语音转换器,那么最好是如果计算是在服务器上完成的。对于像智能手机这样的系统来说,这样一个系统的要求可能太大了。您将有巨大需求的主要区域如下:

  1. 词典将输入语音映射到文本。
  2. 计算语音识别算法运行。

我相信这就是为什么像谷歌这样的公司在服务器上运行语音识别服务而不是在电话上运行的原因。

但是,如果应用程序是一个有限的文字语音,那么它可能值得一试。

一切顺利!

+0

有没有在使用离线模式AppStore的任何应用程序?doesvgoogle搜索iPhone应用程序与服务器进行通信? –

+0

是的。每个智能手机上的谷歌语音搜索应用程序都与服务器通信。我对应用程序商店并不熟悉,也没有听说过任何可以在手机上进行任何操作的应用程序。但不要听我的话。你应该对此做一点研究。 – Sriram

0

是不是pocketsphinx在没有网络连接的iPhone上工作?是不是有一些演示应用程序像VocalKit

http://www.rajeevan.co.uk/pocketsphinx_in_iphone/可能会有所帮助。

+0

levy,pocketsphinx需要字典,我们不得不在字典中提及编码这个词,它会在没有字典的情况下工作吗? –

+0

对不起,我关注的是你的“无网络”部分问题,而不是“无字典”。 –

-3

最佳答案

https://bitbucket.org/sfoster/iphone-tts/src

你可以改变速度间距everythng

+1

这不是OP所要求的完全相反吗? OP要求为文本解决方案发表演讲。上述链接指的是文本到语音的解决方案。我认为两者是不同的。 – Sriram