2013-04-05 28 views
0

我有我的android项目的用户tesseract ocr识别从摄像头拍摄的图像中的文本。但结果不准确。我想使用opencv优化图像。我想,以实现其在Bitmap.Config.ARGB_8888格式解码所拍摄的图像以下:使用tesseract为文本识别优化图像

  1. 检测调整后的图像中的对象。
  2. 一旦对象被识别,计算它的边界w.r.t原始图像。 (这是为了消除相机角度效应)
  3. 通过应用透视变换从原始图像中提取对象。
  4. 应用白平衡消除减轻效果。

在通过与tess_two API提供的例子,他们正在使用Leptonica的图像操作就像画周围的words..But边界框在我的情况下,我想用OpenCV的 ...您的指导将受到高度赞赏...

回答

0

这是很多你要求,并根据对象可能是不可能的。您应该查看关于2D特征检测和对象检测的教程(http://docs.opencv.org/doc/tutorials/features2d/table_of_content_features2d/table_of_content_features2d.htmlhttp://docs.opencv.org/doc/tutorials/objdetect/table_of_content_objdetect/table_of_content_objdetect.html),以查看是否有可用的东西。

白平衡对光照不起任何作用,您应该进行自适应阈值或某种高通滤波。