我一直在努力开发自己的OCR引擎。研究话题之后有点我得出的结论是,有4个涉及主要步骤:光学字符识别开发
- 前处理图像[去歪斜,图像对比度,二值化等]
- 分割图像插入到字符中[以便更容易地分别处理每个字符]
- 通过特征提取/比较和分类识别字符。
- 后处理图像[增加获得最佳的解决方案的机会。]
我的第一步后,我彻底失败了!有人可以帮助我告诉如何执行字符分离&特征提取?即使您可以提供给我一个指向正确方向的链接,我也会非常感激。 在此先感谢! :)
我一直在努力开发自己的OCR引擎。研究话题之后有点我得出的结论是,有4个涉及主要步骤:光学字符识别开发
我的第一步后,我彻底失败了!有人可以帮助我告诉如何执行字符分离&特征提取?即使您可以提供给我一个指向正确方向的链接,我也会非常感激。 在此先感谢! :)
有一篇论文称为Zelnik-Manor和Perona的自调谐谱聚类。这里是链接到他们的页面文件和代码,MATLAB写:
Self-Tuning Spectral Clustering
这种方法可以进行图像分割。您可能想要研究的另一件事是对图像进行特征提取的主题建模。 Blei的任何东西也会有用。
非常感谢你为同样的RDizzl3。事实证明这很有帮助。 :) – vsdaking