2013-03-28 29 views
0

我在SOLR模式中有一个多值字段。我想知道是否有一个现有的标记器/过滤器可以删除空间。例如,给定“solr,apache solr,倒排索引”,我希望将它们作为“solr,apachesolr,invertedindex”。Solr中的空间折叠Tokenizer /滤波器

回答

1

在该字段的索引时间内,您可以使用PatternReplaceCharFilterFactory作为分析器链中的第一个条目。因此,在您schema.xml中定义一个新的字段类型如下:

<fieldtype name="text_no_ws" class="solr.TextField"> 
    <analyzer> 
    <charFilter class="solr.PatternReplaceCharFilterFactory" 
       pattern=" " replacement=""/> 
    ... 

,然后用其作为类型的字段,如:

<field name="keywords" type="text_no_ws" multiValued="true" ... />