2012-03-05 145 views
5

我正在开发一个使用java的桌面应用程序。这个应用程序是供学校的小孩教英语的,其中用户可以上传一些英文音频,可以以任何需要转换成文本文件的格式。在那里他们可以阅读文字。使用java将音频文件转换为文本文件

,我发现了一些API,但我不知道他们。

http://cmusphinx.sourceforge.net/wiki/

我已经看到了计算器对此许多问题,但没有一个是有益的。如果有人能帮助这将是非常感激

谢谢

+4

为了让你知道,你试图达到的目标并不是微不足道 - 而且可能没有一个解决方案可以给你100%的转换......相反,(text2speech)要容易得多。您可能想要查看执行此操作的第三方应用程序/库,而不一定是使用Java,然后将其与它们集成。 – Marcelo 2012-03-05 15:33:00

回答

3

有许多技术和服务可用于执行语音识别。有关某些选择的介绍,请参阅https://stackoverflow.com/a/6351055/90236

我不确定结果是否可以接受教孩子英语作为第二语言,但它是值得尝试。

3

你追求的是什么目前是打破技术优势。像cmusphinx这样的工具可以检测专用的有限字典中的单词(所以你可以教它理解,比如15个单词,就是这样 - 你不能教它理解英语)。

基本上,这些工具试图找到您喂养它们的声波中的模式。他们什么都不懂,他们只是使用相同的算法,然后尝试找到最接近的匹配。这对于一小部分单词来说效果很好,但随着单词数量的增加,之间的差异缩小,而且工作变得更加困难(甚至没有从诸如天气或C以及看到的词开始)。

你可能会考虑什么是“跟着我”的软件。在这里,您需要将测试的所有单词记录为模板。然后你可以记录学生的单词,然后计算差异。如果差别不是太大,那么这个词是正确的。但是,再一次:这是简单的重复来提高发音 - 不是英语。

有能够理解很多英语的桌面软件(例如产品从Nuance,Dragon Naturally Speaking是最突出的之一)。他们确实提供服务器解决方案,但如果预算紧张,该软件不免费或便宜。

相关问题