6
A
回答
3
CMUSphinx实现了pocketsphinx引擎关键词识别,详见FAQ entry.
要识别单一的关键词,你可以在“搜索的关键词”模式运行的解码器。
从命令行尝试:
pocketsphinx_continuous -infile file.wav -keyphrase “oh mighty computer” -kws_threshold 1e-20
从代码:
ps_set_keyphrase(ps, "keyphrase_search", "oh mighty computer");
ps_set_search(ps, "keyphrase_search);
ps_start_utt();
/* process data */
您也可以在我们的消息来源为Python和Android/Java的例子。 Python代码看起来是这样的,完整的例子here:
# Process audio chunk by chunk. On keyphrase detected perform action and restart search
decoder = Decoder(config)
decoder.start_utt()
while True:
buf = stream.read(1024)
if buf:
decoder.process_raw(buf, False, False)
else:
break
if decoder.hyp() != None:
print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()])
print ("Detected keyphrase, restarting search")
decoder.end_utt()
decoder.start_utt()
门槛必须调整对测试数据的每个关键词短语,以获得正确的平衡漏检和误报。你可以尝试像1e-5到1e-50这样的值。
为了获得最佳准确度,最好使用带3-4个音节的关键词。太短的词组很容易混淆。
您还可以搜索多个关键词的,创建一个文件keyphrase.list这样的:
oh mighty computer /1e-40/
hello world /1e-30/
other_phrase /other_phrase_threshold/
而且在解码器-kws配置选项一起使用。
pocketsphinx_continuous -inmic yes -kws keyphrase_list
此功能尚未在sphinx4解码器中实现。
相关问题
- 1. 演讲到文字转换。?
- 2. 演讲PDF?
- 3. JavaScript中的演讲(TTS)
- 4. WinRT上的演讲
- 5. Android(RecognitionListener)现场演讲文本预览
- 6. Silverlight和演讲sdk
- 7. 演讲android系统
- 8. 与Java的演讲比较
- 9. 保持演讲的Android
- 10. 演讲到Android中的文本API
- 11. 演讲到分机转换
- 12. 只有演讲第一次
- 13. 当演讲结束后
- 14. WordNet - 部分演讲要求?
- 15. C#发现使用var关键字
- 16. R:发现包含某个关键字
- 17. 使用VBA的Microsoft Excel演讲 - 讲多个项目?
- 18. Wpf usercontrol的按钮没有触发演讲者的ICommand
- 19. Webkit的演讲 - 的Javascript触发话筒听
- 20. 从演示文稿中删除演讲者备注编程
- 21. 伟大的计算机科学演讲
- 22. 上演节目 - 杰克Bolewski的讲话
- 23. 演讲到模拟器上的文本
- 24. 文本到流星的演讲?
- 25. PocketSphinx在Android中的自己的关键字发现
- 26. 发现关键除了
- 27. 在sql中发现相似的关键字
- 28. 阿拉伯文字在iphone上的演讲
- 29. 我如何用女性的声音做文字演讲?
- 30. 如何发展技能说话/写/做技术专题演讲
是否有算法说明或库在不使用CMUSphinx的情况下在音频流上进行关键字识别? –
当然,你可以谷歌的“关键字spotting” –
是很多研究论文,但没有死简单的实施 –