2012-03-09 27 views
0

我有一个巨大的XML文件,大小约2GB,包含简历。这个文件中有成千上万的简历,正确标记。现在我正在使用XPATH来查询它。那么建议使用Lucene而不是XPATH?为此,建议使用Lucene吗?

回答

1

像所有其他技术相关的,这取决于。

什么Lucene的给你,你没有使用XPath得到的是一个全文引擎除其他事项外排名和能力,短语查询,支持电力,通配符查询等。根据您的使用

- 我想说,在全文搜索引擎是有道理的。这并不是说,香草Lucene是最好的方式去(例如有其他的选择建立在Lucene上)。

3

取决于您的要求。如果您需要全文搜索和全面搜索引擎的所有其他强大功能,Lucene就是要走的路。我会推荐Solr,它建立在lucene之上,并提供更好的API和抽象。

1

2GB似乎是相当少的,我会构建自己的倒排索引(最小的一个:))然而,使用Lucene/Solr虽然没有问题。前进。它会帮助你一旦你的记录开始翻倍。然而,在这种规模(2GB)甚至更大的情况下,许多现实生活中的东西正在使用像关键字这样的SQL进行数据库全文搜索。

+0

非常感谢:)。 – John 2012-03-09 08:21:45