正在试图提取使用我所有的文件盒中提取字符,当我尝试这条线有没有一种方法可以在tesseract中使用Asterix(*)?
unicharset_extractor *.box
它给了我一个错误,它无法找到,而不是加载所有文件盒* .box的。
正在试图提取使用我所有的文件盒中提取字符,当我尝试这条线有没有一种方法可以在tesseract中使用Asterix(*)?
unicharset_extractor *.box
它给了我一个错误,它无法找到,而不是加载所有文件盒* .box的。
我终于做了我自己的工具这一点。 [链接] http://code.google.com/p/serak-tesseract-trainer/
该特定程序不支持这种语法。你必须链中的所有文件盒的名称和饲料给它,如:
unicharset_extractor lang.fontname.exp0.box lang.fontname.exp1.box ...
您可以编写一个脚本(例如,train.ps1)的过程自动化。
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
其实我提出来自动...链接http://code.google.com/p/serak-tesseract-trainer/工具 –