我一直在用这个软件撞墙,已经研究过,而且几乎已经尝试了每个向我建议的库。我目前正在尝试用java编写一个程序,它将从pdf文件中提取文本和图像,并允许我将提取的内容写入一个word文件。我设法使用ICEpdf库提取内容,但问题是我需要能够按照与读取内容完全相同的顺序编写内容。因此,为了澄清,我需要一个图书馆来帮助我跟踪文本和图像的位置,以便我可以将它们放在我的文档中的相同位置。从PDF文件中提取文本和图像
0
A
回答
0
+0
我会如何使用openOffice来做到这一点?它是否支持从PDF到MS Word的直接转换?感谢您的帮助。 – iAmIronMan
0
看看这个:Advanced PDF parser for Java
OFF:
- 也据我所知,是八九不离十转换PDF到HTML(这样你可以跟踪的一个python解析器在pdf中对象的排序)。我知道它不是Java,但你可能能够使用输出。 http://www.unixuser.org/~euske/python/pdfminer/index.html
相关问题
- 1. 从Asp.Net核心提取PDF文件中的图像和文本
- 2. 从pdf文件中提取所有图像和文本
- 3. 从pdf文件中提取文本
- 4. 从pdf文件中提取文本
- 5. 从PDF文件中提取文本
- 6. 从PDF文件中提取文本
- 7. 如何从pdf文件中提取文本和文本坐标?
- 8. 分析pdf文件的格式并提取文本和图像
- 9. 使用iText5从PDF中提取文本和图像
- 10. 如何在Android上使用iText从PDF文件中提取图像和文本
- 11. 从PDF中裁剪和提取文本
- 12. 从pdf文件中提取图片
- 13. 从iOS的pdf文档中读取文本和图像
- 14. 从PDF文档中提取文本 - C#
- 15. 从pdf和word文件中提取文本
- 16. 从PDF中提取图像
- 17. 从PDF中提取图像
- 18. 使用Perl从PDF中提取图像/文本
- 19. AS3 - 从图像中提取文本
- 20. 从图像中提取文本
- 21. 从图像中提取文本
- 22. android:从图像中提取文本
- 23. Vb.net从图像中提取文本
- 24. 从图像中提取文本。 OCR
- 25. 从Dropbox获取PDF文件和图像文件到Android手机?
- 26. 如何从PDF文件中提取图像?
- 27. 从PDF文件提取图层为HTML
- 28. 从文本文件中提到的路径中读取图像
- 29. 提取图像和文字的坐标和大小从PDF
- 30. 使用Python从word文档中提取图像和文本
这是注定不会正常工作的设计。有很多方法可以使图像和文本出现在PDF中。你可能会使用它来处理由单一来源创建的PDF(对你来说是足够的?),但从来没有可靠的PDF。 – Durandal