2014-01-16 58 views
1

我正在寻找一种基于文档边界的文本识别方法。或者可以解决寻找新观点问题的方法。 例如。相机位于点(x1,y1,z1)中,而结果图片具有透视失真,但我们可以找到(x2,y2,z2)让相机更正图片。透视扭曲校正

谢谢。

+0

[这个Sudoku求解器](http://sudokugrab.blogspot.co.uk/2009/07/how-does-it-all-work.html)是一个相关问题的例子 - 它找到了角落照片中的印刷方块会找到一个将其映射到单位正方形的透视变换(尽管它不关心相机坐标)。我认为您需要对您的问题更具体一些。 – finnw

回答

2

通常的做法是假定文档的页面在3D空间中大致平坦,则将包含页面的四边形扭曲成矩形。要做到这一点,您必须估计一个homography,即原始图像和其翘曲对应物之间的(线性)投影变换。

估计需要两个图像之间的匹配点(或线条),文档的常见选择是将原始图像中的页面边角映射到变形图像的图像边角。这通常会产生一个长宽比不正确的矩形(即,扭曲的页面看起来会比真实的“更宽”或“更高”),但是如果您事先知道真实的长宽比是(例如,因为您知道使用的纸张类型,无论是letter,A4等)。

执行估计的简单算法是所谓的Direct Linear Transformation

OpenCV库包含一些例程来帮助完成所有这些任务,并研究它。