2013-05-28 66 views
0

我试图使用SOLR附带的LangDetectLanguageIdentifierUpdateProcessorFactory在索引文档时检测语言。它看起来很简单的实现,我已经把下面给solrconfig.xml中SOLR 4.1语言检测

<updateRequestProcessorChain> 
    <processor class="org.apache.solr.update.processor.LangDetectLanguageIdentifierUpdateProcessorFactory"> 
    <str name="langid.fl">title</str> 
    <str name="langid.langField">language_s</str> 
    <str name="langid.fallback">en</str> 
    <bool name="langid.map">true</bool> 
    <bool name="langid.map.individual">true</bool> 
    <str name="langid.map.individual.fl">title</str> 
    <str name="langid.whitelist">en, fr, de, it, ar, ja, zh-cn, zh-tw</str> 
    <bool name="langid.map.keepOrig">true</bool> 
    </processor> 
    <processor class="solr.LogUpdateProcessorFactory" /> 
    <processor class="solr.RunUpdateProcessorFactory" /> 
</updateRequestProcessorChain> 

但是当我开始的Solr它说无法加载LangDetectLanguageIdentifierUpdateProcessorFactory类。我也试过TikaLanguageIdentifierUpdateProcessorFactory,但没有运气。我可能错过了什么。我是否需要任何其他软件包/库/类以在SOLR中具有多语言检测功能?

回答

1

请确保您有apache-solr-langid-X.X.jarcontrib/langid/lib中的相关罐子可用于solr。

+0

谢谢你的工作 – rusho1234