lucene

    36热度

    3回答

    在Lucene中,如果您有多个只覆盖一个分区的索引。为什么不同索引上的相同搜索返回不同分数的结果?来自不同服务器的结果完全匹配。 也就是说,如果我搜寻: 名称 - 约翰·史密斯 DOB - 1934年11月11日 分区0会返回一个分值的0.345 分区1将返回0.337分数 两者都完全匹配名称和DOB。

    4热度

    3回答

    我有这个长期问题不完全理解如何实现体面的Lucene排序或排名。假设我有一份城市及其人口的列表。如果有人搜索“新的”或“伦敦”,我想要按照人口排列的前缀匹配列表,我有一个前缀搜索和按字段排序的字段,其中有一个人口字段,IE新墨西哥州,纽约;或伦敦德里的伦敦。 但是我总是希望确切的匹配名称位于顶部。因此,就“伦敦”而言,即使伦敦德里的人口多于伦敦的CT,伦敦,伦敦,伦敦德里的伦敦德里的第一个伦敦在英

    7热度

    3回答

    我有一个应用程序做了一段时间的前缀搜索。最近,索引尺寸增加了,结果证明一些前缀对lucene来说太多了。它不断抛出我一个Too Many Clauses错误,这是非常令人沮丧的,因为我一直在看我的JAR并确认所包含的代码实际上没有使用布尔查询。 为什么它不会抛出像Too Many Hits异常之类的东西?为什么增加布尔查询的静态最大子句整数实际上使这个错误消失,当我肯定只使用前缀查询?对于我不了解

    5热度

    4回答

    我想使用Lucene(特别是Lucene.NET)来搜索电子邮件地址域。 E.g.我想搜索“@ gmail.com”以查找发送到Gmail地址的所有电子邮件。 对“*@gmail.com”运行Lucene查询会导致错误,星号不能位于查询开始处。对“@ gmail.com”运行查询不会返回任何匹配项,因为“[email protected]”被看作是一个完整的单词,而且您无法只搜索单词的某些部分。