据说“4916正面训练的例子是手工挑选对齐,规范化,并缩放到24x24的基本分辨率10,000 10,000个负面的例子通过从9500个图像中随机挑选子窗口不包含面孔。“在论文“坚固的实时人脸检测保罗·维奥拉&迈克尔琼斯”中提琴琼斯实验(训练集)
我的问题是什么意思关于手选对齐,规范化,并缩放到24x24的基本分辨率?
“手选对齐”是否意味着他们有4916个不同面孔的4916张正面图像? “规范化”是指每个4916图像具有相同的功能[文件大小,文件类型,图片颜色(灰度/彩色)]? “缩放到24x24的基本分辨率”是否意味着每个4916图像都重新调整为24x24像素?
谢谢你的时间!
我建议看一下演示http://www.cs.stevens.edu/~lxu1/CS559_data/FaceDetection_final.pdf - 它很好地描述了Viola Jones的培训过程以及如何让它更好。 – Lyth