2012-02-14 86 views
1

我创建了多个haar级联分类器。我每次使用不同数量的积极和消极。Haar级联分类器训练问题

例如,

第一分类器: 5000阳性和3000底片
第二分类器: 3000阳性和3000张底片(删除2000冗余/类似的图像)

的这两个效率分类器几乎相同...

问题:

  1. 是否有一种方法可以在训练之前删除数据库中的所有冗余图像?

  2. 什么是训练分类器的理想照明和背景条件?

  3. 数据库中有多少图像被认为是最佳性能的理想选择,还是取决于数据集中的数据类型?

问候,

萨利赫...

回答

1

所有最适合你的工作。

答案:

  1. 我想知道你是如何删除多余的图像,同时训练第二分类。我无法告诉你确切的解决方案。一种解决方案可能是:做一个简单的haar特征,获取两个图像的特征向量(比如F1和F2)。如果F1和F2之间的相关性为零(或小于某个阈值),则图像是相似的。你必须测试这个。如果有效,请让我知道。

  2. 这取决于应用程序。如果想在改变照明和背景的场景中使用分类器,那么这些图像应该包含在训练分类器中。

  3. 培训数据库应该包含许多图像(通常是成千上万的图像)。重要的是图像在外观,幻觉,阴影等方面的变化。数据库中的变化使得分类器更健壮。

+0

谢谢。我通过随机选择相似的图像手动删除它们。这是一个痛苦的任务,这就是为什么我想自动化它。是的,你是对的变化。我想通过丢弃相似的图像来增加变化。 – Saleh 2012-02-22 07:48:45