Lucene索引是否使用tf-idf作为权重?是否可以为每个文档定义自己的统计信息和权重,并将它们“插入”到Lucene中?Apache lucene倒排索引
0
A
回答
0
只要通过这个例子。它可以帮助助你知道你可以把自定义更改在索引过程
http://lucene.apache.org/core/4_3_1/demo/src-html/org/apache/lucene/demo/IndexFiles.html
1
是,默认的评分算法采用了TF-IDF,并在TFIDFSiilarity documentation是完全记录。
有许多方法可以自定义文档的评分。
- 最简单也是最常见的是在查询时在索引时间字段或查询字词上加入提升。
- 许多查询类型修改用于该查询的评分。例子包括ConstantScoreQuery和DisjunctionMaxQuery。
- 您使用的
Similarity
定义了评分算法。您可以选择一个不同的(例如BM25Similarity)。 - 通常可以通过扩展一个更高层次的实现,如
DefaultSimilarity
,TFIDFSimilarity
,或SimilarityBase
相关问题
- 1. Lucene倒排索引访问计数
- 2. 仅将Lucene用作倒排索引
- 3. Apache lucene索引
- 4. lucene是否在搜索时遍历整个倒排索引?
- 5. Java - 倒排索引
- 6. 的Apache Lucene索引作家
- 7. 的Apache Lucene的索引
- 8. Lucene的倒排索引是否存储在内存中?
- 9. 散列索引vs倒排索引
- 10. 搜索引擎中的倒排索引
- 11. Python倒排索引效率
- 12. Python - 查询倒排索引
- 13. 倒排索引节点addword
- 14. 大型XML文件的Apache Lucene索引
- 15. 更新Apache Lucene索引文件
- 16. 从apache lucene索引使用Field.index
- 17. Lucene的Apache不把我的旧索引
- 18. Apache Lucene - 创建和存储索引?
- 19. 手动搜索倒排索引
- 20. 模糊搜索+倒排索引
- 21. 在数据库中创建Lucene索引 - Apache Lucene
- 22. Lucene索引:排除某些术语
- 23. 搜索Lucene索引
- 24. 搜索Lucene索引
- 25. Lucene索引搜索
- 26. Zend Lucene索引
- 27. Lucene索引
- 28. Jackrabbit Lucene索引
- 29. Lucene索引MAXFieldLength
- 30. Lucene索引
[仅链接答案】(http://stackoverflow.com/help/deleted-实现自己
Similarity
,答案)抛在一边,在这个例子中,我没有看到任何文件记录真正被处理的地方。 – femtoRgon