1
A
回答
0
pyPdf模块可能会有所帮助。
相关问题
- 1. 打印网页时提供PDF文件
- 2. ImageMagick只转换pdf的第一页
- 3. 通过HTTP提供文件后,PDF文件损坏
- 4. 只读取文件的第一行?
- 5. 阅读PDF文件并以iText作为下载文件提供
- 6. 从文本文件只读第一行
- 7. nutch只提取pdf文件
- 8. CarrierWave - PDF - 只选择第一页
- 9. APNS:第一次推送只提供
- 10. NGINX只提供php文件
- 11. csv文件只读第一行
- 12. OpenFileDialog只读取第一个文件
- 13. JSHint提供'只读'错误$
- 14. 将多页PDF文件的第一页转换为PNG
- 15. 在网站上提供并保护只读PDF
- 16. 阅读通过$ _GET提供的文件
- 17. 文件并不只在第一页
- 18. 如何生成拇指pdf文件只节点js的第一页
- 19. npm http软件包只提供了一个package.json,没有javascript文件
- 20. 我想提供一些PDF文件与我的应用程序
- 21. 提取的文件总是只读的
- 22. jquery ajax没有提供pdf文件
- 23. 以pdf文件形式提供
- 24. 如何阅读PDF文件。第一次只点击链接下载PDF,但第二次点击链接阅读或查看PDF文件
- 25. 只将第一个Word文档页转换为PDF
- 26. Buffered Reader只读取文本文件中的第一行?
- 27. 如何只读取CSV文件每一行的第一列
- 28. java txt文件读取程序,只读取txt文件的第一行
- 29. 使用Python创建只读pdf文件
- 30. MVC:用http标头提供文件
它没有。 pyPdf需要一个.seek()能够的对象,除此之外,它看起来像pyPdf将整个对象流加载到内存中。所以我需要首先下载整个文件,除非我错过了你的观点。 – andreliebschner
我相信它可以读取部分文件。只下拉部分资源是http的工作(做一个头部请求,验证远程服务器是否接受范围,然后进行范围特定的get-request,然后对结果运行pdf解析器,如果整个页面不是'吨检索,然后请求下一个范围)。 –
我打开了一个PDF文件,并且到达了包含第一页的对象,并且我从endobj被删除到文件末尾,就好像它是一个部分文件下载。 pyPdf(以及我迄今为止所尝试的所有CL实用程序)都抱怨缺少%% EOF。无论如何,即使我要添加EOF,仍然会抱怨丢失的交叉引用表。这比我想象的要难得多。 – andreliebschner