2014-09-05 32 views
2

我正在使用Tesseract Library从MRZ(机器可读区域)图像读取信息。我尝试了一些google images,并且我得到了很好的结果。但是当我去实时图像时,那就是当从iphone相机捕获图像时,我没有得到好的结果。如何设置图像大小以改善OCR输出。

得到了下面的谷歌图像在上述图像

enter image description here

图像尺寸良好的结果是谷歌image.Size是543x83。当我把图像从iphone

enter image description here

以上的图像细节

OCR执行较差。从Iphone.Image大小2205x268

1.How捕获

图片以获取上述实时图像的好成绩?

2.是否存在Tesseract OCR所需的推荐图像尺寸?

回答

2

我已经使用ImageMagick为这种事情取得了一些成功 - 从here免费并可用于OSX,Windows和Linux。这是很难找到通用的参数,这把摆弄周围相当数量的:

#!/bin/bash 

# Enhance image as much as possible for Tesseract OCR 
convert input.jpg -normalize \(-clone 0 -colorspace gray -negate -lat 50x50+10% -contrast-stretch 0 -blur 1x65535 -level 50x100% \) -compose copy_opacity -composite -opaque none -background white -adaptive-blur 3 out.jpg 

# OCR the image and cat the results 
tesseract out.jpg p && cat p.txt 

OCR'ed文本输出:

IDFRADOUEL<<<<<<<<<<<<<<<<<<<<932013 
U506932020438CHRISTIANE<<NI2906209F3 

这是形象,作为编制上面的OCR命令:

enter image description here

+0

对此有何好运?你很安静。 – 2014-09-09 10:14:55

+0

没有Imagemagick,如何使用opencv或任何其他预处理步骤获得高于输出。 – balajichinna 2014-09-09 14:03:16