3
我想弄清楚如何使用Leptonica库提供的分割器进行文档分析。我一直在寻找pageseg.c,但我不认为我完全理解它:(!使用Leptonica进行字符分割
如果我把图像和加载它作为PIX数据类型,我调用pixGetRegionsBinary()来找到每个符号是然后我用文字块面膜,提取每个符号分别
如果我理解正确的话我会有这样的代码:??
Pix* page = pixRead("myImage.tif");
Pix** halftone;
Pix** textline;
Pix** textblock;
if (pixGetRegionsBinary(page, halftone, textline, textblock, 0))
{
//..error message
}
现在是文本块的所有字符或我使用我的错误的分割方法:)?另外我怎么会知道什么时候textblock“数组”结束?
在此先感谢!
编辑26/11/2013
任何有兴趣 - Leptonica Doxygen Documentation - Page Segmentation是整版分割的一个很好的例子!字符分割的