Python tesseract提高了OCR的准确性

我有相当简单的图片，但tesseract没有成功给我正确的答案。Python tesseract提高了OCR的准确性

代码：

pytesseract.image_to_string(image, lang='eng')

例画面给人的

SARVN PRIM E N EU ROPTICS\nBLU EPRINT

结果我也试图以我自己的单词添加到字典中，如果它让更好的东西，但仍然没有。

pytesseract.image_to_string(image, lang='eng', config="--user-words words.txt")

我的单词列表看起来像这样

SARYN 
PRIME 
NEUROPTICS 
BLUEPRINT

我应该如何看待这个问题，也许我预测之前，将图像转换？文字颜色可以在几种颜色之间变化，但背景总是黑色。

2016-11-19 Jaanus

尝试反转图像，然后进行二值化/阈值处理，在使用尝试OCR之前在白色背景上获取黑色文本。

请参阅this post了解Python中图像二值化的提示。

当然，质量越好，输入图像中的文字越清晰，您的OCR结果就越好。

我用一个外部工具将其更改为白色黑色，并得到下面的图像。

2017-01-19 17:45:35

回答