2010-07-05 60 views
6

我有一个音频流,我会从中提取单词(语音)。因此,例如有audio.wav我会得到001.wav,002.wav,003.wav等,其中每个XXX.wav是一个字。用于从音频流中提取单词(语音)的库?

我正在寻找一个库或程序来做到这一点 - 平台并不重要,但我更喜欢开源解决方案。

非常感谢您的帮助。

回答

2

Nuance,制造Dragon Naturally Speaking的公司的号码为Software Development Kits

Audio Mining套件似乎满足您的要求:

龙NaturallySpeaking SDK AudioMining是一个独立扬声器 语音识别工具包, 允许的音频文件中的 语音信息100%的索引。 该技术使用高度准确的 语音识别将音频文件 转换为带有时间戳 信息的XML文本。这可以集成 与标准文本搜索产品 使内容能够快速访问特定音频 内容。

语音到语音+元数据是遥遥领先的难题。一旦你有语音+元数据,提取单词作为单独的音频文件是much more straightforward

+0

NB提到的音频挖掘工具包带有以下警告:“** Dragon AudioMining技术专为美国英语设计,不适用于会议录音或采访。**” – LeeGee 2013-09-20 13:02:04

+0

@greenoldman首选开源解决方案 – 2014-12-02 20:47:36

+0

在Nuance AudioMining上在线查找信息非常困难。而且这似乎是相互矛盾的,因为在1999年的产品发布会上明确提到了会议和采访的转录:https://www.youtube.com/watch?v = yagvFY_rUwM – Christoph 2015-10-22 16:39:05