speech-recognition

9热度

6回答

我对语音到文本算法很感兴趣，但我不确定从哪里开始研究它们。一堆搜索引导我到this，但它从1996年开始，我相当肯定自那以后有了改进。有没有人有这种东西的经验有任何阅读/源代码检查的建议？如果我想进入编写语音识别程序的世界（有时如果您对域没有太多知识，很难知道要搜索什么），或者只是提供关于我应该尝试了解的一般性建议。编辑：我想做一些跨平台的工作，但目前我会针对linux。编辑2：感谢csmb

19热度

1回答

如何在音频文件/流内搜索内容？

我一直想很多不同的搜索技术如何存在，用于搜索文本，搜索图片，甚至视频。但是，我从来没有碰到过的是搜索音频文件中的内容的解决方案。例如：让我们假设我有大约200个播客以mp3，wav和ogg文件的形式下载到我的电脑。它们都被命名为podcast1.mp3，podcast2.mp3等。因此，不可能知道内容是什么，而不会实际听到它们。可以说，我有兴趣了解哪些播客谈论“游戏编程”。我想要的结果被示出为