lucene

36热度

3回答

在Lucene中，如果您有多个只覆盖一个分区的索引。为什么不同索引上的相同搜索返回不同分数的结果？来自不同服务器的结果完全匹配。也就是说，如果我搜寻：名称 - 约翰·史密斯 DOB - 1934年11月11日分区0会返回一个分值的0.345 分区1将返回0.337分数两者都完全匹配名称和DOB。

4热度

3回答

Lucene确切订购

我有这个长期问题不完全理解如何实现体面的Lucene排序或排名。假设我有一份城市及其人口的列表。如果有人搜索“新的”或“伦敦”，我想要按照人口排列的前缀匹配列表，我有一个前缀搜索和按字段排序的字段，其中有一个人口字段，IE新墨西哥州，纽约;或伦敦德里的伦敦。但是我总是希望确切的匹配名称位于顶部。因此，就“伦敦”而言，即使伦敦德里的人口多于伦敦的CT，伦敦，伦敦，伦敦德里的伦敦德里的第一个伦敦在英

7热度

3回答

使用Lucene：如果我做了前缀搜索，为什么会出现太多的子句错误？

我有一个应用程序做了一段时间的前缀搜索。最近，索引尺寸增加了，结果证明一些前缀对lucene来说太多了。它不断抛出我一个Too Many Clauses错误，这是非常令人沮丧的，因为我一直在看我的JAR并确认所包含的代码实际上没有使用布尔查询。为什么它不会抛出像Too Many Hits异常之类的东西？为什么增加布尔查询的静态最大子句整数实际上使这个错误消失，当我肯定只使用前缀查询？对于我不了解

5热度

4回答

使用Lucene搜索电子邮件地址

我想使用Lucene（特别是Lucene.NET）来搜索电子邮件地址域。 E.g.我想搜索“@ gmail.com”以查找发送到Gmail地址的所有电子邮件。对“*@gmail.com”运行Lucene查询会导致错误，星号不能位于查询开始处。对“@ gmail.com”运行查询不会返回任何匹配项，因为“[email protected]”被看作是一个完整的单词，而且您无法只搜索单词的某些部分。