2017-03-21 271 views
1

我在使用Python,OpenCV 3.1和HOG进行有用的检测时遇到了问题。虽然我的工作代码无误地执行,但训练后的HOG/SVM组合无法在测试图像上检测到。使用OpenCV在Python中进行HOG培训和检测

从OpenCV示例和其他堆栈溢出讨论我已经开发了以下方法。

win_size = (64, 64) 
block_size = (16, 16) 
block_stride = (8, 8) 
cell_size = (8, 8) 
nbins = 9 
deriv_aperture = 1 
win_sigma = 4. 
histogram_norm_type = 0 
l2_hys_threshold = 2.0000000000000001e-01 
gamma_correction = 0 
nlevels = 64 

hog = cv2.HOGDescriptor(win_size, 
         block_size, 
         block_stride, 
         cell_size, 
         nbins, 
         deriv_aperture, 
         win_sigma, 
         histogram_norm_type, 
         l2_hys_threshold, 
         gamma_correction, 
         nlevels) 

window_stride = (8, 8) 
padding = (8, 8) 
locations = ((0, 0),) 

histograms = [] 
# not showing the loop here but 
# create histograms for 600 positive and 600 negative images 
# all images are of size 64x64 
histograms.append(np.transpose(hog.compute(roi, window_stride, padding, locations))) 

training_data = np.concatenate(histograms) 
classifications = np.array([1] * 600 + [0] * 600) 

svm = cv2.ml.SVM_create() 
svm.setType(cv2.ml.SVM_C_SVC) 
svm.setKernel(cv2.ml.SVM_LINEAR) 
svm.setC(0.01) 
svm.setTermCriteria((cv2.TermCriteria_MAX_ITER, 100, 1e-6)) 

svm.train(training_data, cv2.ml.ROW_SAMPLE, classifications) 

# testing 
test_img = cv2.imread('test_image.jpg') 
svmvec = svm.getSupportVectors()[0] 
rho = -svm.getDecisionFunction(0)[0] 
svmvec = np.append(svmvec, rho) 
hog.setSVMDetector(svmvec) 
found, w = hog.detectMultiScale(test_img) 

在每一个试验中,found是在图像中居中的单一矩形和不位于其中正位于测试图像英寸

我已经尝试了许多基于堆栈溢出回答和其他OpenCV示例和讨论的不同参数组合。他们都没有改变结果。

+0

详细和组织良好的问题解释应该奖励。我可以问你为什么只使用** svm.getSupportVectors()[0] **的原因吗? – 3yanlis1bos

回答

0

我认为你需要所有支持向量。所以问题不在于你的训练码,而是你的考验。

svm.train(training_data, cv2.ml.ROW_SAMPLE, classifications) 

你做你的训练,你把所有的数据,但是当涉及到的测试,你只用得到的分类器的一小部分。

svmvec = svm.getSupportVectors()[0] 

更改此行,您将有一个较少的问题。

0

在中心创建单个矩形的原因是因为检测器几乎将所有区域都分类为“人”。 默认情况下,detectMultiScale抑制矩形的重叠。所以你只能看到中心的单个矩形。 您可以使用detectMultiScale的finalThreshold选项关闭此抑制。

hogParams = { 'finalThreshold': 0} 
found, w = hog.detectMultiScale(test_img, **hogParams) 

默认情况下,这个参数设置为2 你可以看到几乎所有的区域由矩形的颜色填充。

我对这种“错误分类”的答案是简单地改变标签的顺序。

classifications = np.array([0] * 600 + [1] * 600)