2011-03-23 33 views
1


我有新闻存储与1,000,000条记录我使用lucene库全文搜索我的新闻hast(标题,正文,新闻日期,...)我需要找到最佳查询寻找从用户输入最相关的结果我应该使用什么策略或算法来实现这个用户搜索输入的最佳lucene查询

现在即时通讯使用这样的事情(title^3.0 body^2.0)但我认为它简单我正在寻找更复杂的算法来获取更相关的结果。

我真的很感激,如果你帮我发现我的溢出朋友!

回答

0

提高搜索相关性需要时间和迭代细化。

的LucidImagination团队有很好的写了(非常的Solr虽然为基础): http://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Search-Application-Relevance-Issues

您可能要分析日志,并添加每个文档的浏览量到您的索引,以便您可以因素,在你的排序顺序。

只要捕捉到震级变化,数字不一定非常准确。

您还应该分析错误拼写的日志。 lucidimagination家伙有一些关于索引他们的播客或博客。