有人可以告诉我从哪里开始为本地文件开发一个简单的全文本搜索引擎吗?如何开发一个简单的搜索引擎在本地文件中进行全文搜索
我有一台带有LAMP的Debian 7服务器,并在其上安装了一个Windows网络驱动器。到目前为止,我正在使用this script向其他本地网络用户显示他们可以从装入的网络驱动器下载文件的目录树。
但我必须建立一个简单的搜索引擎,可以索引挂载文件夹中的本地文件的名称和内容(如果有) - Microsoft doc,docx,xls,xlsx,rtf,txt。搜索必须返回文件的名称,路径和最好的文本是否存在搜索词出现的部分(如果文件有文本)。
难道有人指向我正确的方向,我必须阅读和学习如何做到这一点?谢谢。
感谢我会看的文档。你有使用elasticsearch的经验吗? – ispasov
当然,有些。不知道你为什么问,虽然... – femtoRgon
我只是想知道,如果你让我代表你的经验这些解决方案之间的一些comparizon。 – ispasov