我有一些.doc和.pdf文件的文件,我的要求是从我将在运行时提供的.doc或.pdf文件中读取一个特定的页面。这可以通过逐页阅读和在每页的结尾,如果我编号。但一些我得到一些文件编号是不是他们的,所以我怎么能做到这一点?如何从doc或pdf文件中读取特定页面。
是他们的任何API或任何其他逻辑,以便我可以解决这个问题?
你好全部 我有.DOC文件,但我不应该读取整个文件,而是我给了一个页码。 因此我只能从doc文件中读取特定页面。 我正在使用apache.poi api。
file = new File("c://doc/assignment/afternoon_24.doc");
FileInputStream fis=new FileInputStream(file.getAbsolutePath());
我需要读取此文件的第X页并写入文本文件?
关于pdf文件:有多个PDF库,其中许多都允许从单个页面提取文本。是否还有其他要求?许可证?预算?图书馆已经在使用? – mkl
@mkl在我们的项目中,阅读pdf是第二要求如何doc – loknath