7
我正在使用Tesseract库阅读身份证信息。我尝试过使用一些Google images并取得了很好的效果,但是当我使用实时图像时,即从iPhone相机拍摄图像时,我没有得到好的结果。改进Tesseract OCR中的预处理步骤以实时捕获
我发现了Tesseract建议的一些预处理步骤。
1.修复DPI(如果需要)300 DPI最小。
如何在iPhone摄像头实时捕捉图像时设置图像的DPI?
2.修正文字大小(例如12点应该没关系)。
如何解决由iPhone摄像头创建的大图像的文本大小?
3.尝试修复文本行(歪斜和扭曲文本)。
我读到Tesseract使用Leptonica库应用dewarp文本。在这个预处理阶段,文本需要dewarp或deskew。
4.尝试修复图像的照明(例如,没有图像的黑暗部分)。
我可以使用OpenCV执行图像照明吗?
5.二值化和去噪图像。
当我为实时图像应用阈值或自适应阈值时,我得到的二值化图像质量很差。
如何二值化这些实时图像?