Tesseract OCR未能识别全高数字

我已经用示例文本对字母数字和数字进行了测试。我正在使用数字模式。Tesseract OCR未能识别全高数字

如何认识像下面的图片中的数字：

enter image description here

我想这是因为全高的。我也尝试将它转换为.jpg使用一些在线工具（非代码）

我使用pytesseract 0.1.6，但我认为这是Tesseract问题。

这里是我的代码：

def classify(hash): 
    socket = urllib.urlopen(hash) 
    image = StringIO(socket.read()) 
    socket.close() 
    image = Image.open(image) 
    number = image_to_string(image, config='digits') 
    mapping[hash] = number 
    return number 

classify('any url')

来源

2015-04-03 user3002996

直接包含的图片在你的问题，不只是一个链接。 – Almo 2015-04-03 23:27:11

你是什么意思全高？ – tobltobs 2015-04-17 09:21:16

我的意思是文本需要全部高度的图片。假设您有1000x100的图片和高度为100的字母。 – user3002996 2015-04-18 10:24:32