0
我有一个lucene索引,我试图查询。给定一个查询Q
,我想找到所有的结果,比如说最高分的10%。所以如果我的最高结果返回5.0,我想要得到所有分数大于4.5的结果。这可能吗?目前,我只是在做lucene查询结果x%内的结果
IndexSearches.search(Q, 1000);
希望1000比到足以容纳临界值,然后比较分数的阈值。这似乎是额外的工作以及潜在的问题,如果我需要返回并重新查询,如果所有初始1000都高于截止点。有没有更简单的方法来做到这一点?
我看过的所有收藏家似乎都以一些结果作为参数。
是的。情况有点奇怪。我的文档集是静态的,所以添加/删除数据的更改不是问题。我试图对文档进行聚类,查看哪些文档彼此相似,并且类似文档的数量在整个数据集中可能会有很大差异。 –