我试图使用Tessaract从收据和账单中提取数据,我正在使用tesseract 3.02版本。Tesseract训练数据
上午只使用英文数据,仍然输出精度约为60%。
是否有可用的任何训练有素的数据,我只需更换tessdata文件夹
我试图使用Tessaract从收据和账单中提取数据,我正在使用tesseract 3.02版本。Tesseract训练数据
上午只使用英文数据,仍然输出精度约为60%。
是否有可用的任何训练有素的数据,我只需更换tessdata文件夹
这是一个“典型的示例文件”提供的图像尼基在:
看着它,我会明确地说:“忘记它,尼克!你无法训练Tesseract识别这种类型的图像100%的文本!”
然而,你可以训练自己做出更好的照片与的iPhone 3GS(这就是它被用于例如图像的装置)从这种类型的收据。以下是一些提示:
也就是说,像下面的ImageMagick命令将可能有一定程度的增加正方体的识别率:
convert \
http://i.stack.imgur.com/q3Ad4.jpg \
-colorspace gray \
-rotate 90 \
-crop 260x540+110+75 +repage \
-scale 166% \
-normalize \
-colors 32 \
out1 .png
它产生以下输出:
你甚至可以添加如-threshold 30%
作为最后的命令行选项到上面的命令得到这个:
(你应该打几分有一些变化的30%
值来调整结果...我没有这个时间。)
从tesseract获取收据的准确信息是不可能的。您需要添加图像过滤器和一些其他工具,例如OpenCV,NumPy ImageMagick以及Tesseract。 Franck Chastagnol在PyCon 2013上做了演讲,他描述了他的公司是如何做到的。
这里是链接: http://pyvideo.org/video/1702/building-an-image-processing-pipeline-with-python
正是我需要同样的事情,我尝试了一些图像的优化,以提高输出
你可以找到我的实验tessaract这里
在使用Tesseract对文本进行OCR之前,您可以获得更清晰的后处理图像。尝试使用背景表面阈值(BST)技术,而不是其他简单的阈值方法。你可以找到关于here的白皮书。
有是非常有效的BST的OpenCV实现https://stackoverflow.com/a/22127181/3475075
是的,我有我最新版本,不过输出是不好的。 – nicky
如果您不提供至少一个(链接到)典型示例文件,则无法告诉您如何提高准确性。 –
这是图像 – nicky