2015-07-01 35 views
0

到目前为止,我的第一个障碍是在MTG卡的图像上运行tesseract香草不会识别卡片标题(说实话这就是我需要的,因为我可以使用该文本来拉出卡片信息的其余部分从数据库)我认为这个问题可能是需要训练tesseract认识字体在mtg卡的使用,但我想知道是否它可能是一个问题tesseract不寻找或不检测图像中的文本(特别是标题)。在MTG卡上使用tesseract

编辑:包括MTG卡的图像作为参考。 http://gatherer.wizards.com/Handlers/Image.ashx?multiverseid=175263&type=card

+0

发布图像样本 – Photon

+1

什么是MTG卡?他们看起来如何?他们有什么高质量的图像?你使用什么操作系统? –

+0

这里是一个MTG卡的图像示例http://gatherer.wizards.com/Handlers/Image.ashx?multiverseid = 175263&type = card 我已经使用了从600px到1080px的各种不同的分辨率。这是运行Raspbian OS – Greyjedi

回答

0

好了,所以,要在Reddit上编程论坛后,我想我找到了答案,我要去追求:

正方体的训练特征的确是提高了不寻常的字体率,但是这可能不是你成功率低的原因。 文本所处的环境控制得不好 - 卡片背景可以是五种颜色之一的纹理加上文物和土地。 Tesseract在处理之前会对图像产生灰度,因此文本与背景之间的对比度不足。 你可以把你的卡片通过一个预处理器,它将彩色区域静音为白色并增强单调性。这应该会增加对比度,所以tesseract可以确定角色。

如果还有人认为上面的路径是错误的,请说出来。