0
我尝试从此页面运行Pdfbox示例:http://www.printmyfolders.com/Home/PDFBox-Tutorial 从PDF文件中提取文本。当我尝试运行它时,出现错误:尝试运行pdfbox程序时出错
org.apache.pdfbox.exceptions.WrappedIOException
at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:245)
at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1192)
at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1159)
at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1130)
at GetPos.main(GetPos.java:14)
Caused by: java.lang.ArrayIndexOutOfBoundsException
at java.lang.System.arraycopy(libgcj.so.10)
at java.io.ByteArrayOutputStream.write(libgcj.so.10)
at org.apache.pdfbox.filter.FlateFilter.decompress(FlateFilter.java:172)
at org.apache.pdfbox.filter.FlateFilter.decode(FlateFilter.java:98)
at org.apache.pdfbox.cos.COSStream.doDecode(COSStream.java:295)
at org.apache.pdfbox.cos.COSStream.doDecode(COSStream.java:237)
at org.apache.pdfbox.cos.COSStream.getUnfilteredStream(COSStream.java:172)
at org.apache.pdfbox.pdfparser.PDFXrefStreamParser.<init>(PDFXrefStreamParser.java:61)
at org.apache.pdfbox.pdfparser.PDFParser.parseXrefStream(PDFParser.java:848)
at org.apache.pdfbox.pdfparser.PDFParser.parseObject(PDFParser.java:576)
at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:188)
...4 more
这是什么意思? 空白pdf的第一个例子很好。
很抱歉,但它不工作。我不是Java开发人员,也许我错过了什么?你能给我你的* .java文件的完整代码吗? – Footniko
嗯..我在一个空的Maven模块(NetBeans)中进行单元测试。唯一缺少的代码是类定义和构造函数。修改原始帖子以包含完整的.java文件。 – Origineil