2013-10-29 106 views
0

我有一些产品标签只包含数字的示例。不过,我设法处理这些图像,以便我可以使用这些图像来识别数字。我使用英语培训的数据文件,但结果非常糟糕。有没有一种方法可以使用模板图像来训练数据集。如何培训tesseract仅识别数字

我已经提到了培训tesseract的文档,但我无法使用图像进行培训。

但有了盒子文件后,我该如何使eng.traineddata。

有人可以帮助我。

这是产品标签的裁剪原始图像http://imgur.com/hNNlX9g

这是产品标签的处理图像http://imgur.com/Kzxtu0M

回答

0

你可以尝试设置字符的白名单来确认(在你的情况位数) 。该参数被称为tessedit_char_whitelist。诚实的结果可能会混合。