2

据说“4916正面训练的例子是手工挑选对齐,规范化,并缩放到24x24的基本分辨率10,000 10,000个负面的例子通过从9500个图像中随机挑选子窗口不包含面孔。“在论文“坚固的实时人脸检测保罗·维奥拉&迈克尔琼斯”中提琴琼斯实验(训练集)

我的问题是什么意思关于手选对齐,规范化,并缩放到24x24的基本分辨率?

“手选对齐”是否意味着他们有4916个不同面孔的4916张正面图像? “规范化”是指每个4916图像具有相同的功能[文件大小,文件类型,图片颜色(灰度/彩色)]? “缩放到24x24的基本分辨率”是否意味着每个4916图像都重新调整为24x24像素?

谢谢你的时间!

+4

我建议看一下演示http://www.cs.stevens.edu/~lxu1/CS559_data/FaceDetection_final.pdf - 它很好地描述了Viola Jones的培训过程以及如何让它更好。 – Lyth

回答

2

“手选对齐”是否意味着他们有4916 不同面孔的正面图像?

不是十分明显 - 但是,他们给了4916张不同面孔的照片。面孔是由“人类专家”手动找到的。

是否“归一化”是指每一个图像4916都具有相同的特征 [文件大小,文件类型,图像颜色(灰度/彩色)]?

它们只使用灰度像素,标准化意味着它们确保没有“黑色”和“白色”图片。如果图片很暗 - 它会自动变亮,如果图片不够暗 - 则会变黑。这是通过一个自动组件轻松完成的。

“缩放到24x24的基本分辨率”是否意味着每个图像重新调整为24x24像素?

是的,他们通过在图片上应用一些处理来确保每个“脸部”正好是24x24像素。

+0

你是否来自nayakamitarup.blogspot.com? –

+0

非常感谢!你帮了我很多。我还有几个问题。他们如何规格化每个灰度像素?他们使用什么自动化组件?最后,他们使用什么样的培训来生成级联文件(xml文件)?我一直在遵循很多haartraining教程,但还没有能够输出一个好的检测器(xml)。 –

+0

@KojiIkehara:我不是那个艾米特。通常,对于新的问题 - 最好将它们作为新线索(除非这些是对建议答案的澄清) – amit