0
我想以编程方式解析PDF文件,查找特定短语并找出每个短语所在的页码。这是可能的(我知道pdf不像文本文件)?是的,有图书馆可以帮助吗?解析PDF和识别页面上的短语
我想以编程方式解析PDF文件,查找特定短语并找出每个短语所在的页码。这是可能的(我知道pdf不像文本文件)?是的,有图书馆可以帮助吗?解析PDF和识别页面上的短语
Apache Tika,您可以在Apache Lucene project找到,它包含PDFBox,它将提取可以使用它的文本。
您正在尝试使用哪种语言和平台? – mauris 2009-12-30 03:18:30