我希望有人能告诉我为什么它是我的Tesseract在识别一些带有数字的图像时遇到问题,并且如果有什么我可以处理的话。 一切都按照测试工作,因为它只是我需要的数字,我以为我可以用英文模式来管理,直到我不得不从7分段显示器开始。在Tesseract中识别数字时遇到问题 - android
尽管我在附加图像上遇到了很多麻烦,但是我想知道是否应该开始研究自己的识别算法,或者如果我可以为Tesseract创建自己的数据集,然后工作,任何人都知道Tesseract的局限性在哪里?
尝试过的东西: 试图将psm设置为one_line,one_word,one_char(并截取图片)。使用one_line和one_word时,没有显着变化。 与one_char它确实认识到了一点好,但有时,由于间距太大,它附加了一个额外的数字,然后拧它,如果你看看附加的图像然后它导致04. 我也试过自己进行二值化,这导致了较差的识别并且非常消耗资源。 我试图倒置图片,这对tesseract完全没有任何影响。
我附上了需要处理的图片等等。
释有关图片:
是一个形象的正方体有就认出,虽然它在字已作出建设围绕工作图像的应用程序的便利。
是与image_seven匹配的真实生活图片。但它无法识别这一点。
是我想让它识别的另一个图像,是的,我知道它不能被skrewed,而且我做了unskrew(认为skrew是这里的术语==“直接”)。
skrew = skew nice :)。此外,图像工具集可以减少噪音,锐化,而不是。这可能有助于 – 2014-06-05 18:43:53