2012-07-08 30 views
0

我正在尝试开发和算法阅读草书手写(医生的手写是确切的)。我不需要匹配每一个字母,只是可识别的字母(我使用的是字典方式)。Java OCR:阅读草书手写

现在,我有BufferedImage类中的二值化图像。接下来我需要做的是隔离每个角色。

你能提供我一个关于如何实现这一点的伪代码?我想在使用其他库时很少。我想通过学习如何实现每个过程来做到这一点。任何提示?

+0

我认为医生的笔迹在定义上难以辨认 - 即使对于人类... – thkala 2012-07-08 06:56:28

+0

@thkala好,有些字符是可读的。有一个药品名称的字典,这个算法可以帮助识别处方上的特定药物。 – Ruel 2012-07-08 07:00:33

回答

2

您需要了解的Image Moments的东西,从而可以用来比较的图像,即使他们已经旋转或缩放

您需要重的数学背景,以了解如何做到这一点,您可以通过以下方式启动阅读这个http://www.ias.ac.in/sadhana/Pdf2007Oct/521,它是关于如何实现一个特定类型的字符(卡纳达)OCR,相同的一般原则应适用于你正在尝试做什么

除非你愿意花几个月(或几年)在这个追求中,我会建议你使用已有的东西,比如ocropusjavaocr

1

或者,您可以从Vision Objects购买HWR SDK,这将大大减少您的开发工作量。