0
我想从tesseract中提取文本文档的样式信息。这些样式信息包括有关标题,子标题,文本样式的信息,如粗体,斜体和下划线。tesseract代码的哪一部分向我提供了这些信息?有没有办法从tesseract中提取文档的样式信息?
我想从tesseract中提取文本文档的样式信息。这些样式信息包括有关标题,子标题,文本样式的信息,如粗体,斜体和下划线。tesseract代码的哪一部分向我提供了这些信息?有没有办法从tesseract中提取文档的样式信息?
ResultIterator
类有WordFontAttributes
产生字体信息的方法。
如何从tesseract中获取该信息?我希望文档图像中每行的布尔值。 – 2014-09-12 16:17:26
请参阅[API示例](https://code.google.com/p/tesseract-ocr/wiki/APIExample)&[Java示例](http://sourceforge.net/p/tess4j/code/HEAD/tree/ Tess4J_3 /主干/测试/网/ sourceforge上/ tess4j/TessAPITest.java)。 – nguyenq 2014-09-13 17:03:34