2017-05-03 93 views
0

使用PdfReader和ReportLab,我试图拉入一个PDF页面,保存它(都成功),然后拉入一个多页PDF并执行相同的操作。 我知道如何一次拉出一页PDF,但我一直在努力拉动一页以上。ReportLab将多页PDF添加到画布

from reportlab.pdfgen import canvas 
from pdfrw import PdfReader 
from pdfrw.buildxobj import pagexobj 
from pdfrw.toreportlab import makerl 

c = canvas.Canvas(Out_Folder+pdf_file_name) 
c.setPageSize([11*inch, 8.5*inch]) 

page = PdfReader(folder+'2_VisionMissionValues.pdf',decompress=False).pages 
p = pagexobj(page[0]) 
c.setPageSize([11*inch, 8.5*inch]) #Set page size (for landscape) 
c.doForm(makerl(c, p)) 
c.showPage() 

p3_ = PdfReader(m4folder+'Academy.pdf',decompress=False).pages 

这就是我迷失的地方。我知道这个作品只是在第一页拉....

p3 = pagexobj(p3_[0]) 

但是,如果我想在PDF的所有页面拉,我不知道该怎么办。 我尝试这样做:

p3 = [pagexobj(x) for x in p3_[:]] 

,但它导致断言错误(见下文)。

c.setPageSize([8.5*inch, 11*inch]) #Set page size (for portrait) 
c.doForm(makerl(c, p3)) 
c.showPage() 
c.save() 


AssertionError: [{'/BBox': [0.0, 0.0, 792.0, 612.0], '/Filter': '/FlateDecode', '/FormType': 1, '/Matrix': [0, 1, -1, 0, 0, 0], '/Length': '56', '/Subtype': '/Form', '/Resources': {'/ProcSet': ['/PDF', '/ImageB', '/ImageC', '/ImageI'], '/XObject': {'/Im1': (8, 0)}}, '/Type': '/XObject'}, {'/BBox': [0.0, 0.0, 792.0, 612.0], '/Filter': '/FlateDecode', '/FormType': 1, '/Matrix': [0, 1, -1, 0, 0, 0], '/Length': '56', '/Subtype': '/Form', '/Resources': {'/ProcSet': ['/PDF', '/ImageB', '/ImageC', '/ImageI'], '/XObject': {'/Im2': (17, 0)}}, '/Type': '/XObject'}] 

回答

1

的ReportLab的帆布只能在一个页面上的时间,所以你需要使用ReportLab的doForm()和​​功能每个输出页面一次,而不是对所有页面的列表。

编辑补充

我只记得,我有一些示例代码,将一个PDF文件的网页的子集复制到使用ReportLab的here的输出文件。内部循环是这样的:

for page in pages: 
    canvas.setPageSize((page.BBox[2], page.BBox[3])) 
    canvas.doForm(makerl(canvas, page)) 
    canvas.showPage() 

对于什么是值得的,如果你只是复制页面,你不需要reportlab;在上面的目录中有一个与pdfrw完全相同的子集示例。

(声明:我是主pdfrw作者。)

+0

感谢,@Patrick莫平!我有另一个问题,我将作为一个单独的问题发布。 –

+0

新问题在这里:http://stackoverflow.com/questions/43773477/reportlab-and-pdfrw-importing-scanned-pdf –