speech-recognition

    9热度

    6回答

    我对语音到文本算法很感兴趣,但我不确定从哪里开始研究它们。一堆搜索引导我到this,但它从1996年开始,我相当肯定自那以后有了改进。 有没有人有这种东西的经验有任何阅读/源代码检查的建议?如果我想进入编写语音识别程序的世界(有时如果您对域没有太多知识,很难知道要搜索什么),或者只是提供关于我应该尝试了解的一般性建议。 编辑:我想做一些跨平台的工作,但目前我会针对linux。 编辑2:感谢csmb

    19热度

    1回答

    我一直想很多不同的搜索技术如何存在,用于搜索文本,搜索图片,甚至视频。 但是,我从来没有碰到过的是搜索音频文件中的内容的解决方案。 例如:让我们假设我有大约200个播客以mp3,wav和ogg文件的形式下载到我的电脑。它们都被命名为podcast1.mp3,podcast2.mp3等。因此,不可能知道内容是什么,而不会实际听到它们。可以说,我有兴趣了解哪些播客谈论“游戏编程”。我想要的结果被示出为