0
A
回答
1
我不知道在Grails/Groovy中,但是您可以使用Apache lib PDF Box在您的项目中解析PDF。
0
就像另一种选择一样,我一直对Aspose产品获得成功。我与Aspose没有任何关系。我只是喜欢他们的产品。
0
其他选项包括支持pdf和其他格式的Apache Tika和iText。
要将使用Groovy/Grails的使用以下的Java,你会使用Groovy/Grails的
使用Apache蒂卡与Java中,你必须:
- 下载蒂卡-APP-1.2。从tika.apache.org
- 下载this示例程序
- 罐子编译程序用javac -cp蒂卡-APP-1.2.jar TextExtractor.java
- 提取一些文本java -cp tika-app-1.2.jar :. TextExtractor aPDFFile.pdf
与Java使用的iText,你会:
- 下载itextpdf-5.3.5.jar
编译如下:
import java.io.IOException; import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.parser.PdfTextExtractor; public class itextHelloWorld { static void extract(String input) throws IOException{ String path = input; PdfReader reader = new PdfReader(path); int numberOfPages = reader.getNumberOfPages(); for (int i = 0;i<numberOfPages;i++) { System.out.println(PdfTextExtractor.getTextFromPage(reader,i+1)); } } public static void main(String[] args) throws IOException { extract(args[0]); } }
提取文本用java -cp itextpdf-5.3.5.jar :. itextHelloWorld aPDFFile.pdf
相关问题
- 1. 阅读PDF文件
- 2. 阅读PDF文件?
- 3. 阅读PDF文件
- 4. 用php阅读PDF文件
- 5. 用php阅读pdf文件
- 6. 使用java阅读pdf文件
- 7. 使用iText5 for .NET阅读PDF文件
- 8. UnicodeEncodeError当阅读PDF文件使用pyPdf
- 9. 使用javascript阅读PDF文件
- 10. 使用imagick无法阅读pdf文件
- 11. 使用Android阅读PDF文件
- 12. 使用iText库阅读pdf文件
- 13. 如何阅读PDF文件
- 14. 写在PDF文件阅读
- 15. Node.js ENOENT阅读PDF文件
- 16. C++阅读PDF文件
- 17. 阅读使用Grails/Groovy的
- 18. 阅读PDF使用C#.NET
- 19. 使用iText阅读pdf
- 20. 使用Android阅读pdf
- 21. 使用PDF阅读器在iPhone中下载时阅读pdf
- 22. pdf文件文本阅读和搜索
- 23. 用Apache阅读PDF PDF盒
- 24. 在使用Apache POI和Apache PDF阅读器阅读文档,pdf文件中的错位文本框
- 25. ITEXT PDF阅读器无法阅读PDF
- 26. 用iphone阅读PDF
- 27. 用于阅读PDF
- 28. 使用iTextSharp阅读PDF文件附件注释
- 29. 阅读.PDF/txt文件的Android
- 30. NoClassDefFoundError的同时阅读PDF文件
,我不知道该怎么办,因为格式化信息丢失与我贴用于提取PDF数据的方法。也许你可以发布一个后续的Stack Overflow问题来看看如何最好地完成你所要求的。 –