如何训练三个不同笔迹的同一位数的tesseract-ocr？

我在java中制作了一个程序，它从扫描的tiff图像中读取字符，但准确性并不好。如何训练三个不同笔迹的同一位数的tesseract-ocr？

如果我们改变文档中的笔迹，结果会有一点不同。那么有什么方法可以训练tesseract-ocr？

我也使用jtessEditorBox，但没有什么是有帮助的。

2016-12-01 Asmita09

，我建议你去挖掘这个帖子： http://www.tuxrincon.com/blog/training-tesseract-ocr/

获取每个手写的照片。在几张照片上使用“QT Box Editor”与字符关联盒子。然后给他们tesseract为了训练它使用“train.sh”脚本（可能会纠正一些错误）。我没有使用“train2.sh”，因为在我的情况下它似乎适得其反。将所有手写的训练数据文件添加到tesseract配置文件。您可以更改“QT Box Editor”配置以使用其他语言设置您的手写。

来源

2017-12-20 13:15:21 7Tonin

如何训练三个不同笔迹的同一位数的tesseract-ocr？

回答

相关问题