1
我在java中制作了一个程序,它从扫描的tiff图像中读取字符,但准确性并不好。如何训练三个不同笔迹的同一位数的tesseract-ocr?
如果我们改变文档中的笔迹,结果会有一点不同。 那么有什么方法可以训练tesseract-ocr?
我也使用jtessEditorBox,但没有什么是有帮助的。
我在java中制作了一个程序,它从扫描的tiff图像中读取字符,但准确性并不好。如何训练三个不同笔迹的同一位数的tesseract-ocr?
如果我们改变文档中的笔迹,结果会有一点不同。 那么有什么方法可以训练tesseract-ocr?
我也使用jtessEditorBox,但没有什么是有帮助的。
,我建议你去挖掘这个帖子: http://www.tuxrincon.com/blog/training-tesseract-ocr/
获取每个手写的照片。 在几张照片上使用“QT Box Editor”与字符关联盒子。 然后给他们tesseract为了训练它使用“train.sh”脚本(可能会纠正一些错误)。 我没有使用“train2.sh”,因为在我的情况下它似乎适得其反。 将所有手写的训练数据文件添加到tesseract配置文件。 您可以更改“QT Box Editor”配置以使用其他语言设置您的手写。