2015-08-31 51 views
0

我正在尝试使用openCV使用神经网络来读取阿拉伯数字的OCR应用程序。训练神经网络的最佳方法是什么?

我的问题是什么给了我最好的性能和速度?

  1. 输入数字到NN在RGB形式
  2. 输入数字的NN灰度形式
  3. 在二值化的形式
+0

我通过使用灰度数字来实现这一功能非常成功,因为与RGB格式相比,它们提供的功能要少得多,而且功能可能不那么重要。 – Alejandro

+0

当您尝试使用RGB或Binarized形式实现它时,结果如何? –

回答

1

输入数字的NN如果你想想看,颜色信息与识别数字完全无关。它也可能与速度无关,因为它比NN更加预处理(取决于您的设置)。在性能方面,如果你已经实现了一个合适的模型,灰度和二进制之间应该没有太大的区别。但是如果你很好奇,你可以通过对你的训练数据进行二进制化并比较结果来很容易地进行测试。它可能取决于手头的数据(例如,任何现有的噪音会被天真的二值化所放大)。