2015-10-08 75 views
0

是否有可能与itextpdf合并两个PDF文件这样itextpdf:合并PDF文件

  1. pdf-file-1:9行文字第1页:第1页3行文本

  2. pdf-file-2

结果:

pdf-file-3:第1页12行文字,合并的结果pdf-file-1pdf-file-2

+2

不,不管谁问这个问题,不明白使用坐标将PDF的内容添加到页面中。您正在使用Word处理格式误认PDF。这不是iText的限制。这是PDF的限制。 –

+0

好的,谢谢。我没有想到这个 – Valeriane

+0

为了尝试使它工作仍然看[这个答案](http://stackoverflow.com/a/29078954/1729265)。 – mkl

回答

1

是否有可能与itextpdf合并两个PDF文件这样的...

布鲁诺在他的评论中解释说,一般来说,PDFs几乎不知道他们展示的文本,他们不知道关于章节,章节,段落,专栏等。他们甚至不一定知道文本行;我们认为的一条线可能是一些松散的小块抽象坐标上绘制的文本。

因此,您的问题可能无法从所讨论的PDF内部看到。

但是,如果你重新制定它,一些类似的问题是有道理的,例如,

是否有可能与iTextPdf合并这样

  1. pdf文件-1两个PDF文件:1与内容页只填充网页,例如:一小部分仅上半部分

  2. pdf-file-2:1页面也包含仅填充页面一小部分的内容,例如,只有上半部分

结果:

pdf文件,3:1个页面的PDF文件-1的顶部的内容和pdf文件-2右下方的,合并pdf文件-1和pdf文件-2

这确实是可能的结果,尤其是有可能利用iText。虽然这个功能是不可iText的一个明确的特征,iText的确实提供了一个低级别的API,它很容易使实现这种融合功能,如:

  • PdfDenseMergeToolthis answer呈现究竟是干什么的,如上所述,将尽可能多的源页面的内容放在适合的目标页面上;
  • 出现在this answer中,甚至更多地将源页面内容压缩到目标页面上。

虽然这些类没有经过多年的使用和改进而变得硬化,但它们仍然是某些角落案例仍需要考虑的概念证明。

特别是他们只考虑实际的页面内容,而不是注释或类似的活动内容。另一方面,他们甚至将空白页面上绘制的白色矩形视为内容。尽管实际上是可见的,但每个页面最初充满白色的PDF都被认为是完整的。