有一些模型可以识别2类声音,它们是A类和B类。 如何将C类声音识别为异常声音? 我试图设置一个阈值,同时通过帧进行识别。 above 70% -> class A or B
else -> abnormal
例如, 如果声音具有10帧,其结果是 frame 1 2 3 4 5 6 7 8 9 10
A B A B A A A B A A A=7 B=3
-> class A
我有一个数据库的“位置”字段,其中包含以字符串形式的无约束用户输入。我想将每个条目映射到US状态或NULL。 例如: 'Southeastern Massachusetts' -> MA
'Brookhaven, NY' -> NY
'Manitowoc' -> WI
'Blue Springs, MO' -> MO
'A Damp & Cold Corner Of The World.'
实际上,我有一个作业,它需要识别单独的十进制数字作为文本识别过程的一部分。我已经给出了一组数字的JPEG格式图像。每个图像的大小为160 x 160像素。在检查了一些资源后,我设法编写了这段代码,但是: 1)我不确定是否读取图像并在矩阵中调整它们的大小以保持它们是正确的。 2)假设我有30个火车数据图像的数字[0-9]每个数字有三个图像,我有10个图像测试每个图像只有一个数字。如何计算每个测试和火