Tesseract检测线

我正在研究Objective-C中的OCR应用程序。到目前为止，我的图像识别工作还算不错，但我有兴趣检测行/行，以获得更好，更好的结果。Tesseract检测线

我的项目中有tesseract库和leptonica库。我看着baseapi.h为正方体，我相信我所寻找的是叫

Boxa* GetTextlines(Pixa** pixa, int** blockids);

我不知道怎么我的项目中，或者是否是正确的功能我寻求使用此功能的作用。任何人都可以提供有关此事的任何见解？

谢谢！

来源

2013-06-04 Teddy13

检测页面元素（例如块，段落，行，单词等）的标准方法是使用PageIterator类。我不知道如何在Objective-C中做到这一点，但这里有一个C++示例代码供参考：

tesseract::ResultIterator* ri = tess->GetIterator(); 
while (ri->Next(tesseract::RIL_LINE)) { 
    // Do whatever you want with that line 
    // Recognize line's text 
    char* ctext = ri->GetUTF8Text(tesseract::RIL_LINE); 
    // Get line's bounding box 
    ri->BoundingBox(tesseract::RIL_WORD, &left, &top, &right, &bottom); 
}

来源

2013-06-05 13:58:40 rgeorgy

Tesseract检测线

回答

相关问题