2013-03-27 32 views
15

我打算开发一个应用程序,如Word Lens。任何人都可以建议我可以使用的好的图书馆吗?或任何一个解释Word Lens App背后的技术?它是卷轴时间图像匹配还是OCR?我知道像OpenCv,tesseract一些图像处理库...任何帮助,非常感谢...真正的TIme图像处理(OCR)

回答

42

我是Word Lens的创造者之一。虽然有一些OCR库(如tesseract),但我们决定自己设计,以获得更好的结果和性能。我们一般的算法是这样的:

  1. 复制图像从相机,并得到其灰度成分
  2. 水平出图像,从而使文本明确站出来反对的背景
  3. 抽奖箱周围的东西,看起来像字符&句子
  4. do OCR:将每个框中的像素与字符数据库相匹配 - 这实际上很难!
  5. 收集字符成词,在字典中查找(这是很难得的,因为会出现在OCR错误)
  6. 得出结果返回到图像

图像匹配本身是不够好,因为那里有各种各样的字体,文字和语言。

OpenCV是一个很棒的图书馆,可以帮助您学习和了解更多关于计算机视觉的知识。我会建议建立他们的例子,并在那里玩耍。玩的开心!

+0

你会以某种方式结合4和5获得更好的结果吗?作为OCR的局外人,在我看来,你已经通过“5”丢失了信息,这在困难的情况下可能有用。 – 2013-03-28 13:14:32

+1

马丁:很对;例如,'O'非常类似于'0',甚至'8'和'B',所以它有助于保持可能性列表,然后在更多明确的信息可用时在以下阶段进行修剪(一种简单的反馈) – 2013-03-28 17:36:43

+0

@jd。感谢您的评论..我可以知道创建Word Lens需要多长时间吗?你会为OCR建议好的教程吗? – 2013-04-01 06:22:12