2009-12-10 43 views
12

我试图找到一种搜索PDF文件的方法。我来到PHP PDF课程,但我似乎无法找到任何读取/搜索文件流的功能。使用PHP搜索PDF文件

所以,天真的我,我想简单的使用file_get_contents()函数获取流,显然这是一个加密的状输出;)

所以我的问题,是有没有办法通过PDF文件中搜索?我正在寻找纯脚本/免费/开源解决方案,而不是购买一些昂贵的商业软件库。

回答

11

XPDF

有一个博客帖子here可能会有所帮助。

似乎有一些代码here,可以帮助 - 一个简单的类读取PDF成明文。不确定它是否支持解密。

PHP文档中还有很多资源可以帮助您。 Click.

FPDF and FPDI may also help。在经过一番调查后,可能是您最好的选择。**

+0

谢谢,明天我会检查一下! +1 – Ben 2009-12-10 21:40:53

+0

我已经通过你所有的链接,发现所提到的类不支持加密。所以XPDF似乎被遗留下来了,因为我正在使用windowsmachine并安装了xampp,我将所有文件放在x:/ xampp/apache/bin/xpdf /目录中。但我无法执行您发送的博文中提到的命令。有关如何正确设置XPDF的任何建议? (我对web服务器的了解不多......我甚至把这些文件放在正确的目录中吗?) – Ben 2009-12-12 08:23:20

11

大卫·沃尔什尝试this article

+0

感谢您的快速回复,我会阅读并尝试!我会及时向大家发布。 – Ben 2009-12-10 16:49:22

2

一个PHP的搜索引擎叫Sphider具有通过XPDF添加PDF搜索的选项。然后,您可以自定义结果模板以适应您网站的其他部分(如果适用)。

+0

该选项仍然需要安装其他库。 “下载并安装pdftotext和catdoc并设置有位置(路径)conf.php”只需要为MS-Office文件 – jay 2009-12-10 16:59:20

+0

catdoc,pdftotext是XPDF的一部分,我注意到并在FAQ中提到,“索引PDF和doc文件“。 – akamike 2009-12-10 17:25:10

+0

感谢您的回答,为您的努力+1,但不是我正在寻找的东西。谢谢。 – Ben 2009-12-10 21:40:18