0
我试图使用SOLR附带的LangDetectLanguageIdentifierUpdateProcessorFactory
在索引文档时检测语言。它看起来很简单的实现,我已经把下面给solrconfig.xml中SOLR 4.1语言检测
<updateRequestProcessorChain>
<processor class="org.apache.solr.update.processor.LangDetectLanguageIdentifierUpdateProcessorFactory">
<str name="langid.fl">title</str>
<str name="langid.langField">language_s</str>
<str name="langid.fallback">en</str>
<bool name="langid.map">true</bool>
<bool name="langid.map.individual">true</bool>
<str name="langid.map.individual.fl">title</str>
<str name="langid.whitelist">en, fr, de, it, ar, ja, zh-cn, zh-tw</str>
<bool name="langid.map.keepOrig">true</bool>
</processor>
<processor class="solr.LogUpdateProcessorFactory" />
<processor class="solr.RunUpdateProcessorFactory" />
</updateRequestProcessorChain>
但是当我开始的Solr它说无法加载LangDetectLanguageIdentifierUpdateProcessorFactory
类。我也试过TikaLanguageIdentifierUpdateProcessorFactory
,但没有运气。我可能错过了什么。我是否需要任何其他软件包/库/类以在SOLR中具有多语言检测功能?
谢谢你的工作 – rusho1234