2017-09-13 42 views
0

我是新来的弹性搜索。我无法理解文档中字段的提升值的校准和缩放比例。正如我们应该如何决定领域的提升值,以便它按预期工作。我已经浏览了一些在线博客和文档,写道es会对值的提升进行规范化和内部优化?这是如何运作的?促进工作的规范化和内部优化如何进行?这又是如何影响相关性的?

例如:如果我们的文档中有标签,标题,名称和文本字段,我们应该如何确定这些值的提升值?

回答

0

Elasticsearch使用布尔模型来匹配文档,然后使用评分模型来确定相关性(即排名)。评分模型使用TF/IDF评分,并结合一些附加功能。这些TF/IDF分数是针对查询内的每个匹配字段计算的,然后汇总得出文档的总体分数。为了深入研究这个过程,我建议您在查询上运行explain,以查看每个字段的分数是如何影响文档的整体相关性的。

作为您数据的专家,您处于确定哪些字段最能影响文档相关性的最佳位置。找到一个领域的正确提升值是关于调整杠杆,直到找到最符合您期望结果的公式(另外,如果您有用户,A/B测试可以帮助您)。