2012-11-27 89 views
1

我想读每行一个PDF文件行,但我想保持他原来的格式iTextSharp的和pdf

¿我可以做到这一点与iTextSharp的?

我用下面的代码:

private void button1_Click(object sender, EventArgs e) 
     { 

      string text = string.Empty; 
      string path = string.Empty; 
      path = "C:\\Documents and Settings\\Rafael\\Desktop\\Imprimiendo\\Print1.pdf"; 
      PdfReader reader = new PdfReader(path); 

      for (int page = 1; page <= reader.NumberOfPages; page++) 
      { 
       text = PdfTextExtractor.GetTextFromPage(reader, page); 
       richTextBox1.Text = text; 

      } 
      reader.Close(); 
      return; 
     } 

感谢,我真的很需要你的帮助

+0

你是什么意思阅读每​​行一个PDF文件行?你想要维护什么格式?在您的示例代码中,您使用仅提取文本的文本提取器,没有别的,特别是没有格式信息。不久之前有人谈论过富文本提取策略...... – mkl

+0

我需要阅读pdf文件,但与原始格式,我不知道很多关于itextsharp这就是为什么我需要帮助 –

+0

什么'格式'你的意思是?你的意思是字体和样式信息?或者你是指单词的顺序,例如尊重多栏文字? – mkl

回答

1

如果你想读在它小的数据PDF文件,iTextSharp的将是最好的选择,也许找到答案在这里:但是

Reading PDF content with itextsharp dll in VB.NET or C#

,如果你在PDF文件中有大量的数据,iTextSharp的将在实现这一任务的问题。在这种情况下,您可能需要第三方库。这篇文章可以帮助你多少:

Read PDF file in C#

+0

希望它可以帮助你! – 2012-12-05 01:19:55