2012-12-10 77 views
5

有没有什么办法从bash中提取pdf的内容? (我有一个很大的学术论文文件夹,里面有很多标签,比如“1010.3423.pdf”,我想写一个bash脚本来更合理的命名它,比如说用google搜索前几行。)有没有什么办法从bash中提取pdf的内容?

+0

[如何从PDF中提取格式化文本内容]的可能重复(http://stackoverflow.com/questions/2196621/how-to-extract-formatted-text-content-from-pdf) –

回答

3

pdftotext,它可以帮助您从pdf文件中获得标题和作者。然后你可以使用它来谷歌,或自己生成一个文件名。

1

pdf2xml会为您提供更详细的信息,去年我一直在寻找这样的实用程序,其中,我认为pdf2xml是最好的。

相关问题