如何设置图像大小以改善OCR输出。

我正在使用Tesseract Library从MRZ（机器可读区域）图像读取信息。我尝试了一些google images，并且我得到了很好的结果。但是当我去实时图像时，那就是当从iphone相机捕获图像时，我没有得到好的结果。如何设置图像大小以改善OCR输出。

得到了下面的谷歌图像在上述图像

的

enter image description here

图像尺寸良好的结果是谷歌image.Size是543x83。当我把图像从iphone

enter image description here

以上的图像细节

OCR执行较差。从Iphone.Image大小2205x268

1.How捕获

图片以获取上述实时图像的好成绩？

2.是否存在Tesseract OCR所需的推荐图像尺寸？

来源

2014-09-05 balajichinna

我已经使用ImageMagick为这种事情取得了一些成功 - 从here免费并可用于OSX，Windows和Linux。这是很难找到通用的参数，这把摆弄周围相当数量的：

#!/bin/bash 

# Enhance image as much as possible for Tesseract OCR 
convert input.jpg -normalize \(-clone 0 -colorspace gray -negate -lat 50x50+10% -contrast-stretch 0 -blur 1x65535 -level 50x100% \) -compose copy_opacity -composite -opaque none -background white -adaptive-blur 3 out.jpg 

# OCR the image and cat the results 
tesseract out.jpg p && cat p.txt

OCR'ed文本输出：

IDFRADOUEL<<<<<<<<<<<<<<<<<<<<932013 
U506932020438CHRISTIANE<<NI2906209F3

这是形象，作为编制上面的OCR命令：

enter image description here

来源

2014-09-05 19:07:32

对此有何好运？你很安静。 – 2014-09-09 10:14:55

没有Imagemagick，如何使用opencv或任何其他预处理步骤获得高于输出。 – balajichinna 2014-09-09 14:03:16

如何设置图像大小以改善OCR输出。

回答

相关问题