2010-05-15 183 views
1

我花了大约20个小时的编码在c#中使用iText制作发票。 现在,我想使用相同的代码将一些表格转换为html。itext - pdf to html

你知道,如果我能做到这一点?

比如我有这样的:

PdfPTable table = new PdfPTable(3); 
table.DefaultCell.Border = 0; 
table.DefaultCell.Padding = 3; 
table.WidthPercentage = 100; 
int[] widths = { 100, 200, 100}; 
table.SetWidths(widths); 

List listOfCompanyData = (List)getCompanyData(); 
List listOfCumparatorDreaptaData = (List)getCumparatorDreaptaData(proformaInvoice.getCumparatorDreapta()); 

table.AddCell((Phrase)listOfCompanyData.Items[0]); 
table.AddCell(""); 
table.AddCell((Phrase)listOfCumparatorDreaptaData.Items[0]); 

,我想这个表格转换为HTML ...

这可能吗?

回答

1

PDF和HTML是根本不同的显示技术。 PDF比HTML更复杂,这就是为什么你找到这么多的HTML到PDF转换器。另一种方式更困难。

iText的只能做从HTML不过是PDF。

onlineconverters,将采取一个PDF文件,并转换成HTML。还有downloadable实用程序。

我不知道任何.NET库,将做到这一点的。

0

nFOP + XSLT + XML = PDF | doc | HTML

nfop.sourceforge.net/article.html应该给你如何,你需要“微软的Visual J#NET再发行组件包”运行nFOP

开源无成本:)

使用它的想法

K

1

PDF几乎是只写格式。任何时候你的工作流程要求“从PDF中获取数据”,你可能已经搞砸了。

话虽如此,有几种方法为PDF内藏匿的数据:

  • 表单字段没有特别的长度限制,并需要是不可见的。使用iText获取表单数据是微不足道的。
  • 您可以将文件附加到PDF并稍后使用iText将其吸出。
  • DocInfo字段。您可以将字符串填入作者/标题/关键字/ etc元数据字段之一中。一个丑陋的黑客,但很有效。
  • XML元数据。 “新建的”元数据存储在XML模式中。你可以在那里放置任何你想要的东西...虽然iText在每次改变时都会重新生成一些(mod date等)。
  • 自定义键/值。您可以将任何旧的键/值对放入PDF中的任何旧字典中。 Adobe希望您为自定义标签注册公司特定的前缀以避免冲突,但我从未感受到需要。