0
我在SOLR模式中有一个多值字段。我想知道是否有一个现有的标记器/过滤器可以删除空间。例如,给定“solr,apache solr,倒排索引”,我希望将它们作为“solr,apachesolr,invertedindex”。Solr中的空间折叠Tokenizer /滤波器
我在SOLR模式中有一个多值字段。我想知道是否有一个现有的标记器/过滤器可以删除空间。例如,给定“solr,apache solr,倒排索引”,我希望将它们作为“solr,apachesolr,invertedindex”。Solr中的空间折叠Tokenizer /滤波器
在该字段的索引时间内,您可以使用PatternReplaceCharFilterFactory作为分析器链中的第一个条目。因此,在您schema.xml中定义一个新的字段类型如下:
<fieldtype name="text_no_ws" class="solr.TextField">
<analyzer>
<charFilter class="solr.PatternReplaceCharFilterFactory"
pattern=" " replacement=""/>
...
,然后用其作为类型的字段,如:
<field name="keywords" type="text_no_ws" multiValued="true" ... />