2012-02-11 27 views
2

第一我的最终目标是处理与正方体下面的图片: http://ubuntuone.com/72m0ujsL9RhgfMIlugRDWP (我消灭了第二和第三列...)行中的OpenCV(OCR预处理)列检测

但是正方体有虚线背景的问题。所以我的想法是用OpenCV预处理图像。最好的办法是,如果我能以某种方式检测每一行,因为我需要通过应用不同的阈值而不是偶数行来去除虚线背景。有解决我的问题的解决方案吗?到目前为止,我已经发现了霍夫变换和可能的分割,但结果并不是很好(可能是因为参数错误)......但我不确定,如果这些是可能的方法和我最擅长的时间。 列检测也可以,因为第二列只包含数字和第三个字符。将这种“知识”传递给tesseract可以进一步提高检测率。

如果有人能给我一些提示,我将非常感激,如何解决这个问题,以及哪些OpenCV函数最适合使用哪些参数。一些片段给我一个关于不同步骤的公平想法也会有帮助。

预先感谢!!!

亲切的问候。

回答

0

我建议你使用类似侵蚀的东西,因为与字母的宽度相比,点看起来相当小。

或者我会Canny边缘检测与适当的阈值,以便我会放弃相当短和薄的边缘点。

希望这会有所帮助,玩得开心!

+0

嗨,谢谢你的回复。我已经尝试过腐蚀,但是这种“摧毁”了人物,所以ocr。正如我已经说过的,我更喜欢一种方法适当地分割(line + row => cell)图像,因为这将有助于定义tesseract的预期内容。 – asotbb 2012-02-11 16:35:28