2012-06-11 47 views
2

Lucene是一个很好的开源的indexng库,我的问题不在于如何使用这种索引工具,而是为了学习和理解它们是如何设计的。如何设计全文索引系统?

也许我应该读取Lucene的源代码,但我似乎无法找到关于如何完成这项伟大工作的任何教程。

那么,有没有其他方法或书籍可以帮助我获得如何设计这样的索引系统的具体理解?

谢谢。

回答

3

Lucene背后的科学被称为信息检索。当你开始欣赏信息检索背后的算法和数据结构时,你已经完成了,Lucene或Sphinx只是解决你的任务的工具。首先你可以通过Inverted Index数据结构。

有关信息检索算法和数据结构的伟大的书可以在这里找到:http://nlp.stanford.edu/IR-book/这斯坦福文字是一个很好的资源,并在未来以了解如何信息检索系统一个很好的起点设计