2014-09-05 52 views
7

我正在使用Tesseract库阅读身份证信息。我尝试过使用一些Google images并取得了很好的效果,但是当我使用实时图像时,即从iPhone相机拍摄图像时,我没有得到好的结果。改进Tesseract OCR中的预处理步骤以实时捕获

我发现了Tesseract建议的一些预处理步骤。

1.修复DPI(如果需要)300 DPI最小。

如何在iPhone摄像头实时捕捉图像时设置图像的DPI?

2.修正文字大小(例如12点应该没关系)。

如何解决由iPhone摄像头创建的大图像的文本大小?

3.尝试修复文本行(歪斜和扭曲文本)。

我读到Tesseract使用Leptonica库应用dewarp文本。在这个预处理阶段,文本需要dewarp或deskew。

4.尝试修复图像的照明(例如,没有图像的黑暗部分)。

我可以使用OpenCV执行图像照明吗?

5.二值化和去噪图像。

当我为实时图像应用阈值或自适应阈值时,我得到的二值化图像质量很差。

如何二值化这些实时图像?

回答

1
    1. 和2: 当文本具有12的点尺寸,这意味着它在72 DPI占用高度的12个像素。在300 DPI这是大约50个像素。所以你应该从1和2中拿出来,就是你应该试着对拍摄的图像进行分辨率处理,使得文本的线条高度为50像素左右。你如何做到这一点取决于你如何捕捉图像。
  • 这是比较容易要求用户握住照相机直:-)
  • 和5。 。你可以尝试应用一些过滤。同样,要求使用确保适当的照明应用可能会更容易。