回答

8

饲养位图的每个像素直接到神经网络需要大量的训练,并不会用于处理图像的缩放或旋转工作。

为了帮助神经网络进行很好的分类,你需要执行一些预处理步骤。

  • 规范化图像:
    • 调整对比度和亮度,以使图像的直方图的基准图像相匹配。
    • 模糊图像,消除噪音。
    • 使用某个阈值将其转换为黑色&白色。
    • 找到形状的边界框,缩放到预定义的大小。
  • 计算,可用于从另一个区分一个数字图像的不同特征:
    • 的图像—的Euler number告诉你有多少“洞”中有形状(例如两个孔对于数字8)。
    • 白色像素(数字面积)
    • 设定白色像素—的坐标的principal components的数字告诉你如何“长”的形状。
    • ...其他功能,你可以想到,类似的数字往往有相似的值。

主要组分也可以用于标准化形状的转动,使最长轴是垂直的。

这些功能是您输入神经网络进行分类的内容,而不是像素。

+1

其实我已经试图用神经网络来执行类似的任务,我发现(到目前为止),它工作得更好,如果我给实际像素到网络,而不是进行计算,并给网络的计算。当然,我可能没有选择好的计算作为输入。但是到目前为止,如果没有它们,假设图像正常化的程度足够,它就会正常工作。 – Phil 2009-09-27 00:45:05

相关问题