如何获得每个字符检测到的%置信度? 通过四处搜索,我发现你应该将save_blob_choices设置为T. 因此,我在tessdata/configs中的hocr配置文件中添加了一行,并将其称为tesseract。 这是所有我得到在生成的HTML文件:使用配置文件的Tesseract 3.02的角色信心
<span class='ocr_line' id='line_1' title="bbox 0 0 50 17"><span class='ocrx_word' id='word_1' title="bbox 3 2 45 15"><strong>31,835</strong></span>
正如你可以看到没有任何信心,甚至不是每个字的注释。
我没有visual studio,所以我无法进行任何代码更改。但我也接受描述代码更改的答案,以及如何编译没有VS的代码。