2015-12-01 173 views
1

我要提取其中有看起来像下面的图片经纬度数据的视频文字:如何OCR低分辨率图像

this

的形象是非常低的分辨率和正方体和在线OCR未能在没有任何处理的情况下提取文本。我试图使用this删除灰色背景,并减去灰色矩阵,但它没有产生有意义的输出。我转换为HSV来提取黄色的文字,但又没有得到有意义的结果。

我想知道是否有什么办法可以提取文本。最有希望的领先地位似乎是背景灰度,文字是半透明的黄色。

+0

你可以不断尝试各种图像处理技术,但在一定的水平也将是极其困难/几乎不可能能够提取任何OCR数据。这看起来就像其中一种情况,但如果真的需要这样做,那么你只能继续尝试各种方法。 – TheLethalCoder

+0

** JPG **压缩更加衰减......您可以尝试淡化文字或仅提取黄色强度的峰值,但图像质量如此之低以至于甚至无法阅读人物......您可以尝试[简单的OCR](http://stackoverflow.com/a/22879053/2521214)我有其优于神经网络分类器在低质量或非常嘈杂的输入,但不抱太高的期望... – Spektre

回答

1

的主要问题与这些图像是段的字符。如果他们有一个固定的地方,你就完成了。 (跳到下一段。)

如果没有,通过剖面分析定位字符组之间的空隙开始,以减轻任务。对于每个组,尝试识别最左边的字符,然后跳过它以转到下一个字符,依此类推。

字符识别可通过用相同的字体的参考符号直SAD或SSD比较制成。

不要指望太好的结果。

1

一般而言,DPI只是一个数字,所以你可以改变它(我不知道如何在python,但应该有一种方式)。在将它传递给OCR引擎之前,请尝试将其更改为200或300。 如果没有帮助,尝试重新调整其大小200%,除DPI设置为300 此外,最佳效果的OCR是黑白图像,从而尝试在图像上应用图像处理将其变成黑色和白色。 我发现下面的链接,可以帮助你与: Using python PIL to turn a RGB image into a pure black and white image

+0

“更改DPI “对于现有的视频没有任何意义。放大不会改善图像质量。的确,颜色在这里并没有真正的帮助。 –

+0

是的。调整图像大小使其变得模糊并且不会提高识别效果 –

+0

尝试应用插值算法(如resample)来增强调整大小后的图像。 – David