0

我的程序通过PDF读取并提取文本。当它到达空白页时,出现错误“System.InvalidOperationException:无法处理iTextSharp.text.pdf.PdfDictionary类型的内容”,程序停止。如何在使用iTextSharp提取文本时跳过PDF的空白页面?

如何在尝试阅读之前检查页面是否为空?我的程序如果能打到空白页面,我该如何继续?

代码:

for (int i = 1; i <= reader.NumberOfPages; i++) 
    output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy())); 

回答

1

像这样的事情?

for (int i = 1; i <= reader.NumberOfPages; i++) 
{ 
    string tmp = PdfTextExtractor.GetTextFromPage(reader, i, 
        new SimpleTextExtractionStrategy()); 
    if(!string.IsNullOrEmpty(tmp)) 
     output.WriteLine(tmp); 
} 
相关问题