2014-01-15 127 views
0

我一直在用这个软件撞墙,已经研究过,而且几乎已经尝试了每个向我建议的库。我目前正在尝试用java编写一个程序,它将从pdf文件中提取文本和图像,并允许我将提取的内容写入一个word文件。我设法使用ICEpdf库提取内容,但问题是我需要能够按照与读取内容完全相同的顺序编写内容。因此,为了澄清,我需要一个图书馆来帮助我跟踪文本和图像的位置,以便我可以将它们放在我的文档中的相同位置。从PDF文件中提取文本和图像

+0

这是注定不会正常工作的设计。有很多方法可以使图像和文本出现在PDF中。你可能会使用它来处理由单一来源创建的PDF(对你来说是足够的?),但从来没有可靠的PDF。 – Durandal

回答

0

PDF to Word转换器是一个非常复杂的命题。

你最好打赌可能会使用Open Office为你做,甚至不尝试处理中间步骤。

http://www.openoffice.org/api/

+0

我会如何使用openOffice来做到这一点?它是否支持从PDF到MS Word的直接转换?感谢您的帮助。 – iAmIronMan