2014-02-11 57 views
0

我开始为学校开发一个新项目,并且想知道是否有任何资源可用。我在一些开放源代码的OCR项目中涉猎了一些,发现Tesseract是更准确的一个(但仍然有些混乱)。有没有人有一个想法,我可以开始,或者如果他们可以推动我与Tesseract或任何其他图书馆/例子正确的方向。Mobotix IP摄像机的OCR库

将相机放在带有序列号的容器上。需要通过图片(实时数据流的屏幕截图)识别序列号(字符和数字,不同颜色的粗体白色),然后在数据库中查找序列号以获取所需的信息。我很感激任何向正确的方向推动。

该语言最好在Java/C++中,因为我只有这两种编程语言的经验,所以如果我可以使用这两种语言中的任何一种,它都会使我更容易开始。

回答

0

摄像机被放置在带有序列号的容器上。

我认为这意味着您将使用的图像将总是具有相同的尺寸,或多或少。如果不是,则可能必须操作图像,以便覆盖序列的区域在图像之间变化不大。

将相机放置在带有序列号的容器上。 序列号(字符和数字,不同颜色的大胆白色)

您是否正在对图像进行任何预处理?像例如采取任何非白色像素,并把它变成黑色?这将使您的OCR不依赖于图像颜色,从而增加其灵活性。

裁剪要发送到OCR的图像,使其仅包含要解码的数字,还应该改进OCR的功能。

如果这仍然不适合您,您可以尝试并训练您的Tesseract网络,如here所示。