2013-10-24 42 views
0

如何在pdf中获取pdf中包含特定单词的页码?获取pdf中包含特定单词的页码

我能够与读字:

PDFTextStripper s = new PDFTextStripper(); 
String contents = s.getText(pdoc); 
if(contents.contains("SUBSCRIPTION DETAILS")){ 
... 
} 

但无法找到它包含这个词提前

感谢页码。

回答

1

PDFTextStripper允许您阅读确切的页面。因此,您需要遍历所有页面并检查页面是否包含特定字符串:

PDDocument pdoc = ...; 
for(int pageNumber = 1; pageNumber < pdoc.getPageCount(); i++){ 

    PDFTextStripper s = new PDFTextStripper(); 
    s.setStartPage(pageNumber); 
    s.setEndPage(pageNumber); 
    String pageText = reader.getText(pdoc); 
    String contents = s.getText(pdoc); 
    if(contents.contains("SUBSCRIPTION DETAILS")){ 
    ... 
    } 
} 
+0

感谢您的回复。但我想要包含该文本的页码。请让我知道我的问题是否清楚。 – user2914640

+0

您必须遍历页面并检查每个页面。看代码。 – user987339

+0

非常感谢。它的工作现在。 – user2914640