2008-09-27 180 views
4

我们目前正在研究在提交到OCR之前提高图像质量的方法。我们目前使用的OCR引擎是Nuance(v15)的Scansoft API。我们正在研究Lead Tools,但后来决定寻找其他地方。与Lead Tools相关的许可成本太高了。首先,我们正在寻找简单的图像增强功能,例如:去偏斜,去斑,去除线条,去除冲孔,锐化等。我们正在运行.NET和Java软件的混合,但Java解决方案将是首选。在OCR(光学字符识别)之前,您会推荐哪些软件用于图像增强?

回答

4

的Kofax是良好的前处理,但对于清理你所谈论的类型可能是矫枉过正,除非图像是非常糟糕的。除非您的专业是图像处理,否则我建议与提供图像清理和OCR的提供商合作,以便您可以专注于实际添加的值。

我们从ABBYY(ABBY SDK)获得OCR开发工具包许可,并且发现它在图像处理和OCR方面都非常出色。该API非常广泛,示例应用程序,帮助和支持已经超越了令人印象深刻的。我绝对推荐看看。

0

不知道这是否会达到你们需要的标准,但也许你应该看看Paint.Net的一些API。我不知道提取他们的图像处理算法在您的项目中使用是多么容易,但我相信他们会执行一些您正在寻找的事情。此外,它是一个具有MIT许可证的开源项目,所以它应该对业务使用非常友好。

0

也许JMagick,它是ImageMagick的一个开源的Java接口。它以ImageMagick API中的精简Java本地接口(JNI)层的形式实现。它是根据LGPL授权的,所以它不应该是一个明智的许可问题。

http://sourceforge.net/projects/jmagick/

1

声明:我Atalasoft

工作,我们有这些功能和运行时间免版税许可的.NET。

http://www.atalasoft.com/products/dotimage/

我们也有OCR组件包括ABBYY,正方体等和检索的PDF生成(在PDF文本的顶部图像)

0

我建议Intel其零.NET包装成本运行时许可。

0

取决于原始图像的数量和质量。托管代码和成像工具包可以工作,但如果您拥有数百万张图像进行处理,它并不总是最好的解决方案。对于小批量和紧张的预算,我同意以前的海报,项目像Aforge,Paint.NET,和其他开源计算机视觉库将做的伎俩。当然,如果结果没有得到改善,你自己就可以了......至少这可以让你在低成本的情况下将所需的所有东西放在一个应用程序下。

如果您每个月处理几十万张图片,那么我建议您将该过程分成较小的工作流程步骤,并调整每个图片,直到每张图片的成本尽可能接近零。您会发现OCR结果起初会迅速上升,然后会比您预期的更早平稳。 (我不是OCR的一个大风扇,但它有它的地方)

我用商用Windows产品从Recogniform处理和之前的OCR清理图像使用脚本批处理模式调整各种种类的图像。如果图像质量不合格或被OCR引擎拒绝,则会使用由Atalasoft的工具包构建的自定义.NET应用程序手动“修复”。批量处理所有内容,只触摸失败的内容。