ocr

    1热度

    1回答

    import pytesser3 import Image a = Image.open("C:\\Users\\dell\\Desktop\\test.png") b = pytesser3.image_to_string(a) print(b) 我试图制作一个简单的OCR程序,但每当我运行它时,我都会收到以下错误消息。我甚至卸载pytesser3并重新安装它,但没有任何改变。我究竟

    0热度

    1回答

    我有一段代码使用OCR功能调用Microsoft Cognitive Services Vision API。当我将特定图像传递给API调用时,它不会检测到任何单词。通话本身成功并返回200状态。当我通过Microsoft提供的演示UI屏幕使用相同的图像时,它可以工作并读取我期望的字符。 如果我去这个网址https://azure.microsoft.com/en-us/services/cogn

    0热度

    1回答

    我写了一个bash脚本,从扫描的PDF文件中提取纯文本。我有很多PDF文件,但有些是扫描的,有些则不是。所以现在我的主要目标是通过检查PDF是否已经可以搜索来改进我的脚本,所以不需要OCR提取。 我已经试过: pdftext -nopgbrk pdf_file.pdf wordlist 存储可能OCR'ed文字wordlist,所以后来我可以检查它是否是空的,并找出是否是一个可搜索的PDF或没有。

    0热度

    1回答

    我有OCR扫描了大量文档,并且需要在扫描的文件中标识关键字。问题是,因为OCR是不可靠的 - 例如“SUBSCRIPTION”这个词可能最终成为“SUBSCR | P || ON” - 我需要搜索附近的匹配而不是完全匹配。 有谁知道如何搜索文件中的单词“SUBSCRIPTION”,并返回true,如果找到80%的匹配?

    0热度

    2回答

    我使用QT的Tesseract OCR C++库使用此代码 const char* lang = "eng"; QString filename = "D:/image.png"; tesseract::TessBaseAPI tess; tess.Init(NULL, lang, tesseract::OEM_DEFAULT); tess.SetPageSegMode(tesserac

    2热度

    2回答

    我相信这是我的第一个StackOverflow问题,所以请好。 我正在对每个50-200页的PDF(总共约1GB)进行OCR处理,发现我的Macbook Pro上所有可用的100GB剩余硬盘空间都已消失。根据以前的帖子,ImageMagick似乎是here所示的罪魁祸首。 我发现这些文件被称为'magick- *'并存储在/ private/var/tmp中。只有23 PDF,它创造了总计181G

    1热度

    1回答

    有没有办法做到这一点? 我想为我的用户提供一个密钥,用于对他们的图片进行OCR分析,而不会授予他们无限制的访问权限。 非常感谢!

    0热度

    1回答

    我们对Abby Fine Reader非常新颖。我们需要做一些定制来阅读已识别的文本。为此,我们尝试下载Abbyy Fine Reader Engine踪迹,但链接始终将我们导航到Cloud OCR SDK页面。请帮助我们找到下载Abbyy FineReader引擎的方式,通过.Net编程语言来尝试它。 在此先感谢。

    0热度

    1回答

    我们对Abby Fine Reader非常新颖。当我们使用本产品进行OCR时,识别的文本将被传送到文本编辑器窗口。在这里,我们需要通过编程来阅读文本编辑器窗口中的文本,并在文本窗口中进行阅读(请参阅附件)。请建议我们如何通过编程来做到这一点?提前致谢。

    1热度

    1回答

    我正在尝试自动读取车牌。 我已经培训了一个OpenCV哈尔级联分类器,以隔离源图像中的牌照以合理成功。这里是一个例子(注意黑色边界矩形)。 在此之后,我试图清理车牌为两种: 通过SVM隔离分类单个字符。 将清洁后的车牌提供给Tesseract OCR并提供有效字符的白名单。 要清理的板块,我执行以下变换: # Assuming 'plate' is a sub-image featuring th