有一些模型可以识别2类声音,它们是A类和B类。 如何将C类声音识别为异常声音? 我试图设置一个阈值,同时通过帧进行识别。 above 70% -> class A or B
else -> abnormal
例如, 如果声音具有10帧,其结果是 frame 1 2 3 4 5 6 7 8 9 10
A B A B A A A B A A A=7 B=3
-> class A
我正在构建一个网页,我需要在麦克风捕捉特定声音时执行某些操作。我搜索了很多,发现此链接: Write a Program Which Recognizes a Sound and Performs Action 我被困在两两件事: 如何使用基于Java的声音识别虽然网页或 的JavaScript 如何搭配使用任何识别器的两个声音(一个来自麦克风和其他来自保存的文件) 对于声音识别器,使用Sphin