Q

光学字符识别开发

2014-04-14 62 views 1 likes

1

我一直在努力开发自己的OCR引擎。研究话题之后有点我得出的结论是，有4个涉及主要步骤：光学字符识别开发

前处理图像[去歪斜，图像对比度，二值化等]
分割图像插入到字符中[以便更容易地分别处理每个字符]
通过特征提取/比较和分类识别字符。
后处理图像[增加获得最佳的解决方案的机会。]

我的第一步后，我彻底失败了！有人可以帮助我告诉如何执行字符分离&特征提取？即使您可以提供给我一个指向正确方向的链接，我也会非常感激。在此先感谢！ :)

2014-04-14 vsdaking

A

回答

1

有一篇论文称为Zelnik-Manor和Perona的自调谐谱聚类。这里是链接到他们的页面文件和代码，MATLAB写：

Self-Tuning Spectral Clustering

这种方法可以进行图像分割。您可能想要研究的另一件事是对图像进行特征提取的主题建模。 Blei的任何东西也会有用。

2014-04-14 05:47:22 RDizzl3

+0

非常感谢你为同样的RDizzl3。事实证明这很有帮助。 :) – vsdaking

0

计算机视觉系统工具箱现在有ocr功能，可以为您节省麻烦。

2014-04-17 01:51:57 Dima

+0

嗨迪玛。谢谢你的一样。但是，我们的大学计算机有MATLAB R2013a--它还没有'ocr'功能。此外，我希望开发OCR结构，我自己更感兴趣而不是强迫。 – vsdaking

+1

虽然，我仍然在开发相同的过程，但我会推荐这个领域的所有新手，类似于我，请阅读以下书籍 - Character Recognition Systems - 学生和从业者指南Cheriet，Kharma，Liu，和孙恩。最后，一旦我完成了相同的发展，我也会相应地更新这个问题。 :) – vsdaking

相关问题