我们正在将大量推文和博客订阅源存储到solr中。Solr搜索问题
现在,如果用户搜索Twitter提到的类似@rohit,那么只包含单词rohit的记录也将被返回。即使我们做一个精确匹配“@rohit”,我理解这是因为使用WordDelimiterFilterFactory的其将在特殊的字符的,
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.WordDelimiterFilterFactory
我怎么能强迫Solr的到没有“@”返回。我不想删除WordDelimiterFilterFactory,因为splitOnCaseChange和stemEnglishPossessive有帮助吗?希望我清楚。
问候,
罗希特
出于好奇,使用WordDelimiterFilterFactory比whitespacetokenizerfactory有什么优势? – sesmic 2012-01-11 15:12:19
你不使用一个。使用WhitespaceTokenizerFactory时,实际上需要WordDelimiterFilterFactory来使术语可用于搜索。 – 2012-01-11 15:27:40