改进Tesseract OCR中的预处理步骤以实时捕获

我正在使用Tesseract库阅读身份证信息。我尝试过使用一些Google images并取得了很好的效果，但是当我使用实时图像时，即从iPhone相机拍摄图像时，我没有得到好的结果。改进Tesseract OCR中的预处理步骤以实时捕获

我发现了Tesseract建议的一些预处理步骤。

1.修复DPI（如果需要）300 DPI最小。

如何在iPhone摄像头实时捕捉图像时设置图像的DPI？

2.修正文字大小（例如12点应该没关系）。

如何解决由iPhone摄像头创建的大图像的文本大小？

3.尝试修复文本行（歪斜和扭曲文本）。

我读到Tesseract使用Leptonica库应用dewarp文本。在这个预处理阶段，文本需要dewarp或deskew。

4.尝试修复图像的照明（例如，没有图像的黑暗部分）。

我可以使用OpenCV执行图像照明吗？

5.二值化和去噪图像。

当我为实时图像应用阈值或自适应阈值时，我得到的二值化图像质量很差。

如何二值化这些实时图像？

1. 和2：当文本具有12的点尺寸，这意味着它在72 DPI占用高度的12个像素。在300 DPI这是大约50个像素。所以你应该从1和2中拿出来，就是你应该试着对拍摄的图像进行分辨率处理，使得文本的线条高度为50像素左右。你如何做到这一点取决于你如何捕捉图像。
这是比较容易要求用户握住照相机直:-)
和5。。你可以尝试应用一些过滤。同样，要求使用确保适当的照明应用可能会更容易。

2015-04-24 21:26:19

回答