Python新的Python。 我正在使用此代码来提取文本。是否可以提取所有页面并在文件中输出?从PDF中提取文本 - 所有页面和输出 - 使用Python的文件
import PyPDF2
pdf_file = open('sample.pdf','rb')
read_pdf = PyPDF2.PdfFileReader(pdf_file)
number_of_pages = read_pdf.getNumPages()
page = read_pdf.getPage(10)
page_content = page.extractText()
print (page_content)
我觉得你可以参考此链接http://stackoverflow.com/questions/17003185/extracting-entire-pdf-data-with-python-pdfminer/39736947#39736947除了pypdf2 – mikewolfli