ocr

1热度

1回答

import pytesser3 import Image a = Image.open("C:\\Users\\dell\\Desktop\\test.png") b = pytesser3.image_to_string(a) print(b) 我试图制作一个简单的OCR程序，但每当我运行它时，我都会收到以下错误消息。我甚至卸载pytesser3并重新安装它，但没有任何改变。我究竟

0热度

1回答

Microsoft认知服务Vision API检测代码中的任何字符

我有一段代码使用OCR功能调用Microsoft Cognitive Services Vision API。当我将特定图像传递给API调用时，它不会检测到任何单词。通话本身成功并返回200状态。当我通过Microsoft提供的演示UI屏幕使用相同的图像时，它可以工作并读取我期望的字符。如果我去这个网址https://azure.microsoft.com/en-us/services/cogn

0热度

1回答

检查PDF是否可搜索

我写了一个bash脚本，从扫描的PDF文件中提取纯文本。我有很多PDF文件，但有些是扫描的，有些则不是。所以现在我的主要目标是通过检查PDF是否已经可以搜索来改进我的脚本，所以不需要OCR提取。我已经试过： pdftext -nopgbrk pdf_file.pdf wordlist 存储可能OCR'ed文字wordlist，所以后来我可以检查它是否是空的，并找出是否是一个可搜索的PDF或没有。

0热度

1回答

Ruby - 搜索相似字的文件

我有OCR扫描了大量文档，并且需要在扫描的文件中标识关键字。问题是，因为OCR是不可靠的 - 例如“SUBSCRIPTION”这个词可能最终成为“SUBSCR | P || ON” - 我需要搜索附近的匹配而不是完全匹配。有谁知道如何搜索文件中的单词“SUBSCRIPTION”，并返回true，如果找到80％的匹配？

0热度

2回答

不准确的Tesseract OCR数据C++

我使用QT的Tesseract OCR C++库使用此代码 const char* lang = "eng"; QString filename = "D:/image.png"; tesseract::TessBaseAPI tess; tess.Init(NULL, lang, tesseract::OEM_DEFAULT); tess.SetPageSegMode(tesserac

2热度

2回答

Python Wand在使用OCR转换PDF时使用Mac上的所有可用磁盘空间

我相信这是我的第一个StackOverflow问题，所以请好。我正在对每个50-200页的PDF（总共约1GB）进行OCR处理，发现我的Macbook Pro上所有可用的100GB剩余硬盘空间都已消失。根据以前的帖子，ImageMagick似乎是here所示的罪魁祸首。我发现这些文件被称为'magick- *'并存储在/ private/var/tmp中。只有23 PDF，它创造了总计181G

1热度

1回答

为Azure计算机视觉生成一次性使用/时间受限的访问密钥

有没有办法做到这一点？我想为我的用户提供一个密钥，用于对他们的图片进行OCR分析，而不会授予他们无限制的访问权限。非常感谢！

0热度

1回答

如何下载Abbyy FineReader引擎

我们对Abby Fine Reader非常新颖。我们需要做一些定制来阅读已识别的文本。为此，我们尝试下载Abbyy Fine Reader Engine踪迹，但链接始终将我们导航到Cloud OCR SDK页面。请帮助我们找到下载Abbyy FineReader引擎的方式，通过.Net编程语言来尝试它。在此先感谢。

0热度

1回答

通过编程在Abbyy FineReader上进行定制

我们对Abby Fine Reader非常新颖。当我们使用本产品进行OCR时，识别的文本将被传送到文本编辑器窗口。在这里，我们需要通过编程来阅读文本编辑器窗口中的文本，并在文本窗口中进行阅读（请参阅附件）。请建议我们如何通过编程来做到这一点？提前致谢。

1热度

1回答

OpenCV：为OCR分离车牌字符

我正在尝试自动读取车牌。我已经培训了一个OpenCV哈尔级联分类器，以隔离源图像中的牌照以合理成功。这里是一个例子（注意黑色边界矩形）。在此之后，我试图清理车牌为两种：通过SVM隔离分类单个字符。将清洁后的车牌提供给Tesseract OCR并提供有效字符的白名单。要清理的板块，我执行以下变换： # Assuming 'plate' is a sub-image featuring th