2013-04-26 27 views
0

我想以编程方式查找PDF中包含特定子字符串的所有页面,如果他们这样做,那么我想用另一个PDF替换该页面。替换页面不是问题 - 我可以使用PHP的pdflib绑定或pdftk来完成。我不知道该怎么做是如何测试以查看页面是否包含特定的文本。如何查看PDF上的页面是否包含特定文本

任何想法?

+0

取决于文本是否字面上是pdf,或者pdf只是文本的图像......第一种情况很容易处理。另一个,不是很多。 – 2013-04-26 16:51:36

回答

1

我认为你最好的选择是用pdftk在单个页面上分割PDF,然后用xpdf的pdftotext命令将内容转换为文本,然后用PHP或grep搜索结果文本。

相关问题