中提琴琼斯实验（训练集）

据说“4916正面训练的例子是手工挑选对齐，规范化，并缩放到24x24的基本分辨率10,000 10,000个负面的例子通过从9500个图像中随机挑选子窗口不包含面孔。“在论文“坚固的实时人脸检测保罗·维奥拉&迈克尔琼斯”中提琴琼斯实验（训练集）

我的问题是什么意思关于手选对齐，规范化，并缩放到24x24的基本分辨率？

“手选对齐”是否意味着他们有4916个不同面孔的4916张正面图像？ “规范化”是指每个4916图像具有相同的功能[文件大小，文件类型，图片颜色（灰度/彩色）]？ “缩放到24x24的基本分辨率”是否意味着每个4916图像都重新调整为24x24像素？

谢谢你的时间！

我建议看一下演示http://www.cs.stevens.edu/~lxu1/CS559_data/FaceDetection_final.pdf - 它很好地描述了Viola Jones的培训过程以及如何让它更好。 – Lyth

“手选对齐”是否意味着他们有4916 不同面孔的正面图像？

不是十分明显 - 但是，他们给了4916张不同面孔的照片。面孔是由“人类专家”手动找到的。

是否“归一化”是指每一个图像4916都具有相同的特征 [文件大小，文件类型，图像颜色（灰度/彩色）]？

它们只使用灰度像素，标准化意味着它们确保没有“黑色”和“白色”图片。如果图片很暗 - 它会自动变亮，如果图片不够暗 - 则会变黑。这是通过一个自动组件轻松完成的。

“缩放到24x24的基本分辨率”是否意味着每个图像重新调整为24x24像素？

是的，他们通过在图片上应用一些处理来确保每个“脸部”正好是24x24像素。

2012-12-06 23:47:44 amit

你是否来自nayakamitarup.blogspot.com？ –

非常感谢！你帮了我很多。我还有几个问题。他们如何规格化每个灰度像素？他们使用什么自动化组件？最后，他们使用什么样的培训来生成级联文件（xml文件）？我一直在遵循很多haartraining教程，但还没有能够输出一个好的检测器（xml）。 –

@KojiIkehara：我不是那个艾米特。通常，对于新的问题 - 最好将它们作为新线索（除非这些是对建议答案的澄清） – amit

回答