如何在使用iTextSharp提取文本时跳过PDF的空白页面？

我的程序通过PDF读取并提取文本。当它到达空白页时，出现错误“System.InvalidOperationException：无法处理iTextSharp.text.pdf.PdfDictionary类型的内容”，程序停止。如何在使用iTextSharp提取文本时跳过PDF的空白页面？

如何在尝试阅读之前检查页面是否为空？我的程序如果能打到空白页面，我该如何继续？

代码：

for (int i = 1; i <= reader.NumberOfPages; i++) 
    output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));

来源

2012-10-09 boilers222

像这样的事情？

for (int i = 1; i <= reader.NumberOfPages; i++) 
{ 
    string tmp = PdfTextExtractor.GetTextFromPage(reader, i, 
        new SimpleTextExtractionStrategy()); 
    if(!string.IsNullOrEmpty(tmp)) 
     output.WriteLine(tmp); 
}

来源

2012-12-20 11:12:09

如何在使用iTextSharp提取文本时跳过PDF的空白页面？

回答

相关问题