0
我正在使用tesseract ocr为我的最后一年项目培训一门新语言。Tesseract OCR word-dawg不包含在combine_tessdata中
我从我的单词列表中创建了word-dawg。 但是,combine_tessdata结果是相同的,不管我是否包含word-dawg和wordlist或nor。所以我不确定我的训练数据中是否包含word-dawg和wordlist。
的输出是如下: 偏移为0型-1 偏移1型是140 偏移为第二类型是3726 偏移为3型是3904 偏移为4类型346848 偏移量类型图5是347329 偏移为6型是-1 偏移为7类型-1 偏移量类型8 -1 偏移量类型9 -1 偏移量类型10是-1 偏移量类型11是 - 1 类型12的偏移量为-1 类型13的偏移量为354078 类型的偏移量14是-1 类型15的偏移量是-1 类型16的偏移量是-1
我认为偏移量2是针对unicharambigs的。 任何想法哪个偏移量是word-dawg? 其余的抵消如何?
这非常有帮助!谢谢! – KingOfMyHeart
同时,你碰巧知道inttemp文件中的值是什么?所以有8个colums,看起来像这样 - 3400 0000 fbff ffff 0200 0000 3400 0000.每列代表什么? – KingOfMyHeart