2015-01-02 94 views
4

您好,我正在尝试在图像上进行拍摄。与同一图像上的tesseract的不同结果

enter image description here

这是经过一些预处理 (跳过预处理部分,因为它不是真的与我的问题,但如果有人需要它会共享)

我有了这个图像

原始图像

enter image description here

,当我尝试用正方体

到OCR这一形象0

我得到的结果作为

HN' 

2809 

但是当我手动裁剪上的Photoshop

enter image description here

我收到

HN' 

Z8 

,结果一半的图像部分。

不知什么这两个图像之间的差异,因为一个给代替ž但对方一给ž

我知道我必须平滑边缘以获得更精确的结果,但运动模糊,高斯模糊和普通模糊滤镜确实会改变我得到的结果。

回答

2

超正方体实现了拾取数超过信基于在附近的数量和数字式Z的算法:

  • 在第一图像,它会猜测超过ž,因为它的邻居都是数字(809),所以它假设第一个数字也必须是一个数字。

我以前有过这个问题。 :(

顺便说一句,我想你应该翻转图像的第一部分,所以HN'变得.NH