1

我正在为视频分类创建一包视觉词汇。我没有使用SURF描述符,这就是为什么我不能使用OpenCV的BOWImgDescriptorExtractor用于此目的。 我提取了我的描述符,我自己将它们聚类。我现在有我的词汇量(4000码)。我应该做的是将我的训练描述符分配给这些聚类,并为下一步创建视觉直方图。我应该如何做这个预测,并为创建的字典中的训练数据创建视觉直方图?训练数据集群的BOW预测

回答

0

为了将描述符分配给簇,必须选择一个距离度量。一个简单的选择就是欧几里德距离。然后,您需要计算从训练描述符到每个聚类质心的距离,并将它们分配给质心比描述符更接近任何其他聚类的质心的聚类。

在您为图像上的所有训练描述符完成此操作后,计算分配给每个群集的描述符数量,然后构建直方图。不过,对于训练集中的所有图像必须重复该过程。由于描述符的数量可能随着图像而变化,所以直方图通常在作为用于训练的特征向量馈入分类器之前被归一化。