2013-07-31 62 views

回答

0

对您的问题默认为5,但您可以根据需要进行更改。

尽管如此,你有2个不同的阈值: mlt.mintf,最小期限频率 - 低于该术语将在源文档被忽略的频率,DEFAULT_MIN_TERM_FREQ = 2 mlt.mindf,最小文档频率 - 处的频率至少在这么多文档中不会出现的字将被忽略,DEFAULT_MIN_DOC_FREQ = 5

我建议看看http://wiki.apache.org/solr/MoreLikeThis的所有细节。

如果你想了解“更多类似这样的”工作,我也建议阅读这篇优秀的文章http://cephas.net/blog/2008/03/30/how-morelikethis-works-in-lucene/

0

我要说的条款应显示(ATLEAST)的200个文件(共40000)将其提交给建议清单。

40000分之200= 0.005

200 - >号的文件,其中一个特定的术语是本。
40000 - >文件总数。