如果我有40000个文档索引,我的阈值是.005。在搜索建议中出现之前,有多少文档应包含某个关键字?Solr建议:有多少文档。应该包含某个词
1
A
回答
0
对您的问题默认为5,但您可以根据需要进行更改。
尽管如此,你有2个不同的阈值: mlt.mintf,最小期限频率 - 低于该术语将在源文档被忽略的频率,DEFAULT_MIN_TERM_FREQ = 2 mlt.mindf,最小文档频率 - 处的频率至少在这么多文档中不会出现的字将被忽略,DEFAULT_MIN_DOC_FREQ = 5
我建议看看http://wiki.apache.org/solr/MoreLikeThis的所有细节。
如果你想了解“更多类似这样的”工作,我也建议阅读这篇优秀的文章http://cephas.net/blog/2008/03/30/how-morelikethis-works-in-lucene/
0
我要说的条款应显示(ATLEAST)的200个文件(共40000)将其提交给建议清单。
40000分之200= 0.005
200 - >号的文件,其中一个特定的术语是本。
40000 - >文件总数。
相关问题
- 1. Nutch/Solr - 文档中至少包含一个巨大词条=“content”
- 2. 一个类应该包含多少行?
- 3. 在Solr中包含多字停用词
- 4. Solr - 包含多个单词的同义词
- 5. 批次 - 打开该文件名中包含某个词
- 6. 如何在`solr`中找到仅包含搜索词的文档
- 7. Solr建议与多个有效载荷
- 8. 从Solr返回单个词建议
- 9. 对于包含查询词的文档不返回Solr文档片段
- 10. 单个集合在mongoDb中可以包含多少个文档?
- 11. 我应该使用twitter bootstrap选项卡包含多少文件?
- 12. mongodb全文搜索建议多个词
- 13. 我应该在WAR中包含多少个Portlet?
- 14. 如何处理SOLR中的“文档包含至少一个巨大的术语”?
- 15. Solr可以在文件中包含多语言停用词吗?
- 16. 有多少个id可以包含itemref?
- 17. 应该创建多个文档类型还是多个索引?
- 18. 含有子元素的Solr文档?
- 19. solr不建议完整的单词
- 20. 该评论应该包含在Hubot的文档中?
- 21. 我应该创建多少个线程?
- 22. 我应该创建多少个DTO?
- 23. 返回关于Solr的整个文档建议
- 24. Solr建议不返回多个条款
- 25. Solr建议者:回复多个字段
- 26. 我应该多长时间将文档上传到CloudSearch(Solr)?
- 27. 在solr中包含同义词
- 28. - 建议的最大对象大小应该是多少?
- 29. 有多少个HTTP动词?
- 30. 如果行包含某个单词,请复制包含该单词的单元格