2012-04-10 50 views
0

我们有多个PDF其中有账户表和资产负债表。我们尝试了很多转换器,但结果并不令人满意。任何人都可以推荐任何可以将PDF内容复制到HTML中的精确结构的好转换器。如果任何付费转换器在那里,请给我建议。良好的PDF到HTML格式转换器为移动

This is the PDF we want to convert and Show in html "http://www.marico.com/html/investor/pdf/Quarterly_Updates/Consolidated%20Financial%20Results%20-%20Q3FY11.pdf" 

回答

1

你看过这个吗? http://pdftohtml.sourceforge.net/

它也是开源的,所以它是免费的,可以根据需要进行修改。

甚至有一个演示显示之前的PDF和HTML版本之后。不错,如果你问我。

如果您在使用PDF格式的表格时遇到问题,那么问题可能出在表格本身以及用于生成它们的程序上。并非所有的PDF都是相同的。

ALSO:要知道,我已经创建了多年来遇到的所有PDF有很多问题,当涉及到复制/粘贴块/文本有其他文本块/线线在任何给定的页面上相等或更高的高度。我认为Acrobat缺乏定义在什么(或大多数程序不能正确使用它)之后选择哪个块的“顺序顺序”的能力,因此系统类从一种自上而下,从左到右的方式选择内容.....即使这意味着跳过大面积的空白区域或一次从多列抓取行,当你不期望它。这可能是您的表格数据问题的一部分。你这里的薄弱环节就是PDF格式本身,我想也许你可能期望得到它太多。将任何东西变成PDF都是单向的,特别是当你开始在其中编辑大量可编辑的文本时。

+0

是感谢ü的答复,但我已经调查该链接,我不能从中获得所需的输出答案 – 2012-04-10 11:11:07

+0

您好感谢,但我需要转换此PDF在其原始结构[链接](http://www.marico.com/html/investor/pdf/Quarterly_Updates/Consolidated%20Financial%20Results%20-%20Q3FY11.pdf) – 2012-04-11 07:05:16