1

我一直在努力开发自己的OCR引擎。研究话题之后有点我得出的结论是,有4个涉及主要步骤:光学字符识别开发

  1. 前处理图像[去歪斜,图像对比度,二值化等]
  2. 分割图像插入到字符中[以便更容易地分别处理每个字符]
  3. 通过特征提取/比较和分类识别字符。
  4. 后处理图像[增加获得最佳的解决方案的机会。]

我的第一步后,我彻底失败了!有人可以帮助我告诉如何执行字符分离&特征提取?即使您可以提供给我一个指向正确方向的链接,我也会非常感激。 在此先感谢! :)

回答

1

有一篇论文称为Zelnik-Manor和Perona的自调谐谱聚类。这里是链接到他们的页面文件和代码,MATLAB写:

Self-Tuning Spectral Clustering

这种方法可以进行图像分割。您可能想要研究的另一件事是对图像进行特征提取的主题建模。 Blei的任何东西也会有用。

+0

非常感谢你为同样的RDizzl3。事实证明这很有帮助。 :) – vsdaking

0

计算机视觉系统工具箱现在有ocr功能,可以为您节省麻烦。

+0

嗨迪玛。谢谢你的一样。但是,我们的大学计算机有MATLAB R2013a--它还没有'ocr'功能。此外,我希望开发OCR结构,我自己更感兴趣而不是强迫。 – vsdaking

+1

虽然,我仍然在开发相同的过程,但我会推荐这个领域的所有新手,类似于我,请阅读以下书籍 - Character Recognition Systems - 学生和从业者指南Cheriet,Kharma,Liu,和孙恩。最后,一旦我完成了相同的发展,我也会相应地更新这个问题。 :) – vsdaking