2013-04-03 48 views
1

我正在使用PIL,OpenCV和OCR阅读器来阅读来自图像的文本。我面临的最大问题是涉及到图像处理,使文本足够清晰,以便通过OCR阅读器进行简单/准确的提取。为此,我想增加对比度/亮度,并使用PIL进行直方图均衡化,但这并没有帮助原因。如何让图像中的文字更清晰地使用PIL?

那么,你会建议如何使文本显示更清晰的文字提取?

回答

2

PIL有sharpen and edge enhancing filters。这是你想要的吗?显示您正在处理的示例图像会很有帮助。

您的图像背景颜色不均匀,可能会导致问题。试着看看this solution创建一个很好的平坦b & w图像。

但黑领也会造成问题,你应该看看它的方式。

这么说,我得到一个简单的PIL锐化滤镜合理的改进:

锐化滤镜后

正方体结果:

从我学到的东西找里面的人,^我决定人类 众生在飓风与冰块之间}某些 方面,永久神秘,但在其他地方 - 具有足够的科学 和仔细probingefullyly'scrutablerr这将是愚蠢的 认为我们已经达到了人类知识的极限因为它是t认为我们可以知道一切。仍然有足够的空间让 变得更好,问我甚至死亡的问题,从 知道我们什么时候我的简单确定性是错误的。

和结果不带过滤器:

从我了解到lnnkmg韦德枫} FVE deculed lunnuan WLNG ;. el'。 .y.w.r-a'是between a luurrlctuvr null llva la全部。'一个。 I ll respects, permanently unyst:-rwnt Ml ln ms。与足够的scaena) 和turutul pmlulng lm.rely谨慎。这将是他作为loallsla 感谢我们已经达到了人类知识llmlts作为我们认为 我们可以知道一切。我们还有足够的空间让 更好,问问“甚至死亡的人”,当我们简单的证书是错误的时候知道知道的。

+0

我处理像这样的文本中提取出的图像:http://distilleryimage5.s3.amazonaws.com/f7d64cc299d111e2b82c22000a1fbca3_7.jpg我使用的Tesseract,但它的精确度是非常少的,这一点我相信可以通过更好地处理图像来改善,并且可以锐化形成文字的线条。 – Hick

+0

@Hick看我的更新。您应该在提交的问题的文本中包含这些额外的细节(图片和您正在使用Tesseract的事实)。 – Paul