2016-09-20 82 views
0

我正在开发一个web应用程序,并且使用Solr作为搜索引擎。我想添加自动完成功能。为此,我添加了Suggester组件,并为其配置了一个单独的字段。这工作正常。从Solr返回单个词建议

问题是Suggestedter返回字段的整个值。例如,如果一篇文章的名称是“具有新闻价值的项目”,并且我搜索“新的”,它将返回整个“具有新闻价值的项目”,我希望它只返回“新闻价值”。换句话说,返回单个单词标记。

的模式是这样的:

<fieldType name="text_autocomplete" class="solr.TextField" positionIncrementGap="100"> 
    <analyzer> 
    <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
    <filter class="solr.LowerCaseFilterFactory"/> 
    </analyzer> 
</fieldType> 

<field name="term" type="text_autocomplete" indexed="true" stored="true" multiValued="false" /> 
<field name="weight" type="float" indexed="true" stored="true" /> 

<copyField source="name" dest="term"/> 

的值复制到“项”字段。 Solr配置:

<!-- Search component --> 
<searchComponent name="suggest" class="solr.SuggestComponent"> 
    <lst name="suggester"> 
    <str name="name">suggester</str> 
    <str name="lookupImpl">AnalyzingLookupFactory</str> 
    <str name="dictionaryImpl">DocumentDictionaryFactory</str> 
    <str name="field">term</str> 
    <str name="weightField">weight</str> 
    <str name="suggestAnalyzerFieldType">text_autocomplete</str> 
    <str name="buildOnStartup">false</str> 
    </lst> 
</searchComponent> 

<!-- Search handler --> 
<requestHandler name="/suggest" class="solr.SearchHandler" startup="lazy"> 
    <lst name="defaults"> 
    <str name="suggest">true</str> 
    <str name="suggest.count">10</str> 
    <str name="suggest.dictionary">suggester</str> 
    <str name="suggest.build">true</str> 
    </lst> 
    <arr name="components"> 
    <str>suggest</str> 
    </arr> 
</requestHandler> 

任何人都可以建议一个架构和/或配置,使建议者返回一个单词吗?

回答

1

而不是solr.SuggestComponent尝试使用solr.SpellCheckComponent。由于SuggestComponent旨在提供完整的词组。 你可以在这里查看solr.SpellCheckComponent的细节。

http://wiki.apache.org/solr/SpellCheckComponent

为您快速参考,你可以用这个试试。

<searchComponent name="suggest" class="solr.SpellCheckComponent"> 
<lst name="spellchecker"> 
    <str name="name">suggest</str> 
    <str name="classname">org.apache.solr.spelling.suggest.Suggester</str> 
    <str name="lookupImpl">org.apache.solr.spelling.suggest.fst.FSTLookupFactory</str> 
    <str name="distanceMeasure">org.apache.lucene.search.spell.JaroWinklerDistance</str> 
    <str name="field">term</str> 
    <str name="accuracy">0.7</str> 
    <float name="thresholdTokenFrequency">.0001</float> 

</lst> 
</searchComponent> 
+0

这很好,谢谢! – Knut