我想创建一个答案纸标记(选择题)python应用程序。答案纸将被扫描到图像文件(gif,png,jpg,无论需要什么格式)。Python OCR:将扫描图像转换为文本进行处理
我的应用程序可以访问存储所有答案的数据库。
所以,它需要的只是扫描图像中的某种数据,以便它可以比较答案并计算出标记。
的答卷已经固定,像这样的表格式(答案将在“X”标记由候选人表明自己的答案)尺寸:
通过网络搜索后,我发现有几个OCR API可用。
第一个是Pytesser
。它非常易于使用,结果相当不错。但它只适用于纯文本的图像。所以,我认为这是不合适的。
我发现的第二个是Ocropus
。这似乎强大,但在它的文档
的Windows
OCRopus依赖于POSIX路径名和文件系统有很多。 您可能可以在Windows上使用安装OCRopus。更简单的方法 是安装VirtualBox并在Ubuntu下在VirtualBox下运行OCRopus。
所以我认为它主要是为Linux。我找不到窗户平台的详细安装指南。 (我是初学者,所以我可能是错的)
我发现的第三个是python-tesseract
,包装为Tesseract OCR
。在他们的page中,提供了安装指南。基本上,我需要,
- 蟒蛇,正方体,win32.deb
- 蟒蛇,OpenCV的
- numpy的
,但我对如何在窗口安装.deb
文件没有任何线索。我已安装opencv
和nampy
。
因此,下面是我的问题:
(1)在其办法可以将表格转换成图像处理数据(它甚至有可能?)?
(2)有没有其他有用的OCR API,我在这里没有提到可能有用? (3)最后(我的愚蠢想法)是否可以使用PIL
将图像拆分为小卡盘(基于表格单元的大小 - 因为表格尺寸已知),然后使用pytesser
将每个小图像转换为文本,然后相应地处理数据?
供参考:我只需要它的Windows平台,可能为Windows XP 32位。我正在使用Python 2.7.5。
.deb是Linux Deiban/Ubuntu pachage文件,您基本上不要在Windows上安装这些文件。 – McAbra