pypdf

0热度

1回答

我正在寻找将PDF转换为纯文本格式的最简单方法。 PyPDF2似乎是很容易的，这里是我有： def test_pdf(filename): import PyPDF2 pdf = PyPDF2.PdfFileReader(open(filename, "rb")) for page in pdf.pages: print page.extractText() 但它给了我：从Py

4热度

1回答

PdfReadWarning：PdfFileReader流/文件对象不是二进制模式

我有很多pdf页面，我想将它们合并到一个文件中。我的脚本如下： from PyPDF2 import PdfFileMerger,PdfFileReader filename_list=[] merger = PdfFileMerger() for i in range (0,66): filename='page'+str(i)+'.pdf' if not filen

10热度

3回答

如何使用Windows安装pyPDF2模块？

作为一个新手......我在安装pyPDF2模块时遇到困难。我已经下载了。在哪里以及如何安装（setup.py），以便我可以在Python解释器中使用模块？

0热度

1回答

PyPDF2 mergeTranslatedPage没有以正确的方式合并页面

我尝试使用PyPDF2将2个PDF页面合并为一个。这里PDF示例文件http://ge.tt/9IvaIo01 但是，当我尝试合并，我recive每一页的副本，从顶部和底部。这里的示例演示何时使用第0页和第1页上的mergeTranslatedPage，您将收回第2页和第1页上的非副本。也许是我的错或误解。谢谢。 from PyPDF2 import PdfFileReader,PdfFil

0热度

1回答

pyPDF2类型错误时，从LIB从

了pyPDF2 LIB跑这里例如： https://github.com/mstamy2/PyPDF2/tree/Python3-3 当试图运行脚本“示例1：”从那里看到： PyPDF2 python versions (2.5 - 3.3) compatibility branch Traceback (most recent call last): File "1.py", l

0热度

1回答

如何从使用PyPDF2上传到Google App Engine的PDF中提取文本？

有没有什么办法从通过Google app引擎上传的PDF文件中提取文本和documentInfo？我想用PyPDF2，和我的代码是这样的： pdf_file = self.request.POST['file'].file pdf_reader = pypdf.PdfFileReader(pdf_file) 这给了我错误： Traceback (most recent call last):

1热度

1回答

如何计算使用PyPDF2边框在Python 3

0热度

1回答

PyPdf2可以识别通配符

我正在创建一个使用PyPdf2的python脚本。我试图在文件名中使用通配符打开和追加文件。它在字面上取文件名。有没有办法在PyPdf2中声明带有打开和合并功能的通配符？如果是这样，怎么样？

0热度

2回答

PYPDF水印返回错误

嗨即时尝试水印PDF文件使用pypdf2虽然我得到这个错误，我不知道出了什么问题。使用Python 2.7.6在Windows 32位pypdf2 1.19 Traceback (most recent call last): File "test.py", line 13, in <module> page.mergePage(watermark.getPage(0)) File "C

0热度

3回答

pdf中的文本提取中的换行

我正在编写一个关于提取pdf中的文本的函数，我也使用pyPdf库。提取是好的。但是我遇到了一些像排除换行符一样的问题。于是我找到一个方法来添加一个新行，所以我这样做： # Iterate pages for i in range(0, pdf.getNumPages()): # Extract text from page and add to content conte