我已经用示例文本对字母数字和数字进行了测试。我正在使用数字模式。Tesseract OCR未能识别全高数字
如何认识像下面的图片中的数字:
我想这是因为全高的。 我也尝试将它转换为.jpg使用一些在线工具(非代码)
我使用pytesseract 0.1.6,但我认为这是Tesseract问题。
这里是我的代码:
def classify(hash):
socket = urllib.urlopen(hash)
image = StringIO(socket.read())
socket.close()
image = Image.open(image)
number = image_to_string(image, config='digits')
mapping[hash] = number
return number
classify('any url')
直接包含的图片在你的问题,不只是一个链接。 – Almo 2015-04-03 23:27:11
你是什么意思全高? – tobltobs 2015-04-17 09:21:16
我的意思是文本需要全部高度的图片。假设您有1000x100的图片和高度为100的字母。 – user3002996 2015-04-18 10:24:32