2017-04-19 100 views
-1

简短版本:请给我一个建议,以发布一个问题,帮助我使用JAVA编程将PDF转换为TEXT。关于PDF主题位置的建议

详情: 我一直在努力尝试使用JAVA将PDF更改为文本文件,并尽量保持格式尽可能接近PDF。我目前一直在使用一个单独的,免费的第三方程序来完成转换,然后我制作的JAVA程序完成了我想要的所有功能。我问了很多地方,大多数推荐的PDFBox没有用。所有PDFBox所做的都与Adobe Read X所做的一样,这会造成大量文本混乱。我尝试了很多东西,花了很多时间。我现在要做的就是共享一个我正在尝试转换的PDF文件,希望有人可以用一些可以帮助转换的JAVA代码来帮助我。我只是真的有权分享这个旧文件一次(即使你我99%肯定可以在其他地方分享这个文件也没问题),我想在最有效的地方发布这个问题。

+1

你的问题似乎只是寻求建议:1)一个Q&A网站和2)替代PDFBox的。建议请求是无关紧要的。 –

+0

为什么不简单地建立一个单一的可执行文件或脚本,通过以正确的顺序调用它们来使用现有的程序? –

+0

嗨Stefan Hegny - 我从来没有尝试过。我会把它作为一个选项来看看,看看我能否弄清楚如何做到这一点。谢谢! –

回答

0

那么短版(和真正回答我的问题,实际) 答案是:http://stackoverflow.com

特别感谢@TilmanHausherr谁超出去按照我的更新和帮助我更多。

       Longer version. 

我仍然有一些格式问题,但我想我可以自己找其余的。就我所要求的使用Java正确格式化文档而言,已经完成了。至于这个问题被问到这个文档的格式是否正确,它看起来不像我用过的其他东西那么漂亮。

之后,我被卡住了,因为会话后格式化不正确。我之前已经问过,大多数人都说这太难解释了。最后,我必须重新学习如何附加PDFBox,解决其他人遇到的常见问题,以及TilmanHausherr的一行代码,如评论中所示。

当我开始这个项目时,我不得不学习如何让PDFBox与我的IDE一起工作以及如何安排库。等等。然后,我继续找到一些使用PDFBox从PDF转换文本的旧搜索代码。我无法分享用于转换的代码,但需要大约4到5分钟才能搜索原始海报。为了使其工作起来,我还需要对其代码进行一些修改,但我只是遵循IDE中的提示:Eclipse。

我用这个代码写入文本文件,而不是一个格式:

String textFromMain = textForAll; 
try( PrintWriter out = new PrintWriter("text.txt") ) { 
    out.println(textFromMain); 
}