1
在我的文档中,我有一个名为Tag和SuperTag的字段。每当标签匹配时它会提高一些分数,但是如果在SuperTag上匹配,它将显着提高以使其成为第一选择。在你看来,我应该为Tag和SuperTag增加什么样的价值?谢谢。我应该把什么分数放在elasticsearch的增强字段
在我的文档中,我有一个名为Tag和SuperTag的字段。每当标签匹配时它会提高一些分数,但是如果在SuperTag上匹配,它将显着提高以使其成为第一选择。在你看来,我应该为Tag和SuperTag增加什么样的价值?谢谢。我应该把什么分数放在elasticsearch的增强字段
这是很难回答的问题,它非常依赖于现场包含的数据和他们拥有的分析仪。
显然,如果数据将几乎相同,我会设置一个在超级领域的提升到2.0
。
万一他们不持有相同的数据,我们能想象的场景是这样的:
{tag: 'tagnice tagnice tagnice'}
{supertag: 'tagnice'}
即使有提高的SuperTag,标签可能是更相关的,只是因为tf-idf
赋予了它更大的成绩。
为了解决这个问题,例如,设置为两个独立过滤器的分析仪将会有所帮助。
如上所述,它非常依赖数据以及如何将其存储在lucene中。乍一看,如果不知道这么多,那么提高一倍就会奏效。
标记和SuperTag数组或字符串? – farid
一个字符串,但将在索引上标记。 – Anonymouse