pypdf2

    1热度

    1回答

    我一直在尝试大约一个星期来自动从pdf中提取图像。不幸的是,我在这里找到的答案没有任何帮助。我使用pypdf2在相同的代码中看到了多个变体,全部都是['/XObject'],这导致了KeyError。 我正在寻找的东西似乎隐藏在流中,我在pypdf2的字典中找不到(即使在递归探索整个结构之后,在我能找到的每个间接对象上调用.getObject())。 使用pypdf2我已经写了一页pdf并打开它使

    0热度

    1回答

    我正在使用PyPDF2处理多个pdf文件,但我的脚本挂在某处。我在控制台中看到的是一些“startxref与offset偏移量相同的行”,我正确的是一个警告,所以它仍然应该到finally块并返回一个空字符串。 我做错了什么? import PyPDF2 import sys import os def decode_pdf(src_filename): out_str=""

    1热度

    1回答

    这是How to insert a "missing" page as blank page in PDF with Python?的重写,但我试图使用PdfFileWriter其他方法:cloneDocumentFromReader()和addBlankPage(),因为它看起来更清晰。 我需要在PDF的末尾添加一个空白页,如果它包含奇数页,但页面数大于1 所以我想这样做: from PyPDF

    -1热度

    3回答

    我写了一些代码来读取“pdf”文件的特定页面中的数据,并使用python将其写入csv文件。它只是部分工作。但是,将数据写入csv文件时,它会将这些数据写入一行而不是常规模式。我应该如何修改脚本以达到目的?提前致谢。 这是我到目前为止已经试过: import csv from PyPDF2 import PdfFileReader outfile = open("conversion.csv

    2热度

    1回答

    我正在检查文件系统中的损坏的PDF。在我正在运行的测试中,有近200k PDF。看起来好像更小的损坏的文件警报正确,但我碰到一个大的15 MB文件损坏,代码只能无限期地挂起。我试过将Strict设置为False而没有运气。这似乎是最初的问题。而不是做线程和设置超时(我曾尝试在过去很少成功),我希望有一个替代方案。 import PyPDF2, os from time import gmtime

    0热度

    1回答

    基于https://programtalk.com/python-examples/PyPDF2.PdfFileWriter/,示例2,我尝试将附件添加到PDF文件中。 这里是我的代码,我试图运行: import os import PyPDF2 from django.conf import settings ... doc = os.path.join(settings.BASE_

    0热度

    2回答

    我想将元数据键值对添加到pdf文件的元数据中。 我发现了一个几岁的答案,但我认为这是复杂的方式。我想今天有一个更简单的方法:https://stackoverflow.com/a/3257340/633961 我没有与pypdf2结婚,如果有一个更简单的方法,那么我走这条路?

    0热度

    1回答

    我想根据他们所在的县来生成pdf文件。如果每个县有多个pdf文件,那么我需要根据县域密钥将文件附加到单个文件中。我似乎无法获得基于密钥追加的地图。生成的最终地图看起来是随机的,往往会附加太多的文件。我很确定我没有正确分组它们。我已经读过一个键中的多个值可能导致多次显示。有人可以告诉我如何分别访问每个键的每个值,只有一次?很显然,我不了解某些至关重要的事情。 我的代码: import csv, os

    1热度

    1回答

    我尝试在Python 3中使用PyPDF2模块,但我无法显示'页面大小'属性。 我想知道在扫描到PDF文件之前纸张尺寸是多少。 事情是这样的: import PyPDF2 pdf=PdfFileReader("sample.pdf","rb") print(pdf.getNumPages()) 但是我正在寻找另一个Python函数,而不是例如getNumPages()... 下面这个命令打

    0热度

    1回答

    当我使用下面的代码 from PyPDF2 import PdfFileMerger merge = PdfFileMerger() for newFile in nlst: merge.append(newFile) merge.write('newFile.pdf') 出事了如下: raise utils.PdfReadError("EOF marke