2013-06-04 35 views
2

我正在研究Objective-C中的OCR应用程序。到目前为止,我的图像识别工作还算不错,但我有兴趣检测行/行,以获得更好,更好的结果。Tesseract检测线

我的项目中有tesseract库和leptonica库。我看着baseapi.h为正方体,我相信我所寻找的是叫

Boxa* GetTextlines(Pixa** pixa, int** blockids); 

我不知道怎么我的项目中,或者是否是正确的功能我寻求使用此功能的作用。任何人都可以提供有关此事的任何见解?

谢谢!

回答

0

检测页面元素(例如块,段落,行,单词等)的标准方法是使用PageIterator类。我不知道如何在Objective-C中做到这一点,但这里有一个C++示例代码供参考:

tesseract::ResultIterator* ri = tess->GetIterator(); 
while (ri->Next(tesseract::RIL_LINE)) { 
    // Do whatever you want with that line 
    // Recognize line's text 
    char* ctext = ri->GetUTF8Text(tesseract::RIL_LINE); 
    // Get line's bounding box 
    ri->BoundingBox(tesseract::RIL_WORD, &left, &top, &right, &bottom); 
}