我有一个巨大的pdf文件(20 MB/800页),其中包含一些信息。用于从java读取巨大.pdf文件的最佳API
它有索引超链接。其余大部分信息均以表格格式(pdf格式)。我需要使用Java检索这些信息并将其存储在SQL Server中。
哪个是可用于从Java读取此类文件的最佳API?
我有一个巨大的pdf文件(20 MB/800页),其中包含一些信息。用于从java读取巨大.pdf文件的最佳API
它有索引超链接。其余大部分信息均以表格格式(pdf格式)。我需要使用Java检索这些信息并将其存储在SQL Server中。
哪个是可用于从Java读取此类文件的最佳API?
这是不太可能在PDF中的表格格式为PDF不包含结构信息n除非在创建时明确添加。我写了一篇文章,解释了从PDF提取文本的一些问题:http://www.jpedal.org/PDFblog/2009/04/pdf-text/
确实iText失败? – Nishant 2011-02-09 05:13:27