2014-03-06 105 views
3

我有一个索引将一些字段存储为数组,因为它们可能有多个值,比如第一个/最后一个名字,因为我们在Maiden名称上保留历史数据,昵称ectElasticsearch查询字段有多个值,一个匹配得分相等

 { 
     "_index": "structured", 
     "_type": "entity", 
     "_id": "0000230799", 
     "_score": 1, 
     "_source": { 
      "FIRST_NAME": [ 
       "Deborah", 
       "Debbie" 
      ], 

      "LAST_NAME": [ 
       "Loverde", 
       "Frogameni" 
      ] 
     } 
    }, 
    { 
     "_index": "structured", 
     "_type": "entity", 
     "_id": "0000309483", 
     "_score": 1, 
     "_source": { 
      "FIRST_NAME": [ 
       "Anthony", 
       "Tony" 
      ], 
      "LAST_NAME": "Frogameni", 
    }, 

然而,当我这样做,其中一个文档对属性有多个值的搜索,它会给出比一个文件,让只在使用匹配

属性有一个价值较低的分数指数在上方,它获得了第二个更高的纪录,因为第一个纪录有两个姓氏,而第二个纪录是一个

我怎么能说如果我匹配多个值的字段上的一个值,它被评为相同的 作为只有一个值的字段?像Max我需要在这里匹配是1

POST /structured/entity/_search?explain=true 
    { 
    "query": { 
     "bool":{ 
      "should":[ 
      { 

        "match_phrase_prefix":{ 
        "FIRST_NAME":{"query":"debbi"} 
        } 

      }, 
      { 

        "match_phrase_prefix":{ 
        "LAST_NAME":"frogameni" 
        } 

      } 

    ] 
     } 

    } 
} 

任何帮助非常感谢

回答

1

考虑切换到BM25-similarity model。具体而言,您要将b的值设置为0

另外,下面是Elasticsearch/Lucene的默认相似度模型和BM25:Similarity in Elasticsearch的深度比较。

+0

,请在您的elasticsearch.yml文件中放入index.similarity.default.type:BM25。优秀的答案! –

0

您申请最低也要匹配在错误的地方设置。您还需要将其设置为2而不是1,因此您必须匹配这两个术语。试试这个代替

{ 
    "query": { 
    "bool": { 
     "should": [ 
     { 
      "match_phrase_prefix": { 
      "FIRST_NAME": { 
       "query": "debbi" 
      } 
      } 
     }, 
     { 
      "match_phrase_prefix": { 
      "LAST_NAME": "frogameni" 
      } 
     } 
     ], 
     "minimum_should_match": 2 
    } 
    }, 
    "from": "0", 
    "size": "11" 
} 
+0

好吧,我明白了,但如果我添加了第三个标准,我总是会碰到我最低的应该匹配,我的问题应该是我怎么能说一个场上的两个值匹配得分相同作为相同字段上的匹配,只有其他人查找的值为 –

相关问题