2014-02-19 161 views
5

我有一个需要使用OCR扫描特定图像的项目。 我知道软件abbyy finereader做得很好(也尝试了一个几乎完美的试用版),现在我想知道如何将这个软件嵌入python或其他sripting语言,以便我可以稍后简单地运行一个命令行脚本,例如python the_script.py image.jpg以图像为参数,用它执行abbyy精读器并返回识别的文本...Abbyy Finereader命令行用法/ python用法?

我在google上找不到方法,有没有!?我只发现这样的事情: https://github.com/mikesname/python-ocrlab/blob/master/ocrsite/ocrlab/nodes/abbyy.py ,但不能解决它真正的问题......

或者哪一块abbyy软件我需要这样做!?识别服务器或OCR引擎或其他东西?

非常感谢

+0

我想你应该从ABBYY获取试用许可证,只是问他们。如果我没有错,你有权在试用期间支持我已经尝试过他们的云SDK,并且有一个你在python中描述的确切的命令行例子,我认为它们对于所有的SDK产品都是一样的 –

+0

可能对此感兴趣在这些Linux [shell脚本](https://github.com/cove/scanbd)提供的xorgar831 [这里](https://news.ycombinator.com/item?id=12416607) – zelusp

回答

8

我一直在使用ABBYY技术超过15年。我曾经为ABBYY工作,现在我在WiseTREND工作 - 这是ABBYY在美国的主要技术VAR和集成商之一。

FineReader,即零售盒装产品,专为运营商独立交互使用而设计。命令行和API自动化在该程序包中不可用。如果您的使用量较小,可以使用FineReader Corporate Edition作为简单的黑盒,将其设置为热文件夹,然后让脚本将图像放入该输入文件夹,等待处理以及从输出文件夹中拾取。

为了实现更好的自动化和集成,需要使用与FineReader不同的产品。

首先,决定是否想要本地软件或基于云的OCR。

Cloud - ABBYY,OCR-IT和其他一些提供商通过Web请求提供OCR。通常每页付费,并且不需要购买软件。

本地 - 某些软件将在您的服务器上运行,并为您的脚本提供OCR功能,如黑匣子或通过直接API。识别服务器是下一个要考虑的产品。最后,如果您正在开发一个需要将其分发给众多用户的大型应用程序,或者需要深入的OCR控制,那么Engine SDK是需要考虑的产品。

如果您想分享更多关于如何集成OCR的方式,以及您需要实现哪些数量和功能,我们可以尝试缩小范围。

+0

我会联系你通过关于缩小产品建议的邮件 - 回答问题(精读器的命令行用法),谢谢! – tim

4

我看到这条消息很晚,但我使用ABBYY命令行10年。

我更喜欢ABBYY 8,因为它可以更快地完成同样的工作,并且不会打开任何GUI。它配备了FineOCR.exe

“C:\ ABBYY FineReader 8 \ FineOCR.exe” %1 /郎希腊语英语/发送MSWORD

它确实OCR并打开微软Word。 FineOCR.txt是一个简单的帮助文件。

关于ABBYY 11,12(所有版本),有一个FineCmd.exe。使用类似于:

“c:... \ FineReader \ FineCMD。exe文件”%1 /郎希腊语英语/发送MSWORD

它做什么FineOCR以前那样(但没有.TXT帮助文件)。