据说从Solr 3.2发布以来,Carrot与Solr的集成得到了改进,但对我来说却是不同的。我有一个绝对相同的可配置的Solr 1.4.1服务器,运行的是Carrot工作良好,Solr 3.2只给了我“其他主题”。这让我疯狂,因为我没有得到任何例外或任何不寻常的东西。即使结果XML看起来是一样的...Solr3.2 Carrot2除了“其他主题”聚类
但是我没有做了许多修改,聚类组件的标准配置:
<searchComponent name="clustering"
enable="${solr.clustering.enabled:true}"
class="solr.clustering.ClusteringComponent" >
<lst name="engine">
<str name="name">default</str>
<str name="carrot.algorithm">org.carrot2.clustering.lingo.LingoClusteringAlgorithm</str>
<str name="LingoClusteringAlgorithm.desiredClusterCountBase">20</str>
<!--custom-->
<str name="LingoClusteringAlgorithm.phraseLabelBoost">8.00</str>
<str name="TermDocumentMatrixBuilder.titleWordsBoost">6.00</str>
<str name="carrot.lexicalResourcesDir">clustering/carrot2</str>
<str name="MultilingualClustering.defaultLanguage">ENGLISH</str>
</lst>
<lst name="engine">
<str name="name">stc</str>
<str name="carrot.algorithm">org.carrot2.clustering.stc.STCClusteringAlgorithm</str>
</lst>
</searchComponent>
<requestHandler name="/clustering"
startup="lazy"
enable="${solr.clustering.enabled:true}"
class="solr.SearchHandler">
<lst name="defaults">
<bool name="clustering">true</bool>
<str name="clustering.engine">default</str>
<bool name="clustering.results">true</bool>
<str name="carrot.title">autocomplete</str>
<str name="carrot.url">autocomplete</str>
<str name="carrot.snippet">autocomplete</str>
<bool name="carrot.outputSubClusters">true</bool>
<str name="defType">edismax</str>
<str name="qf">
text^0.5 autocomplete^1.2 ata^1.0 raum^1.0 system^1.0 assy^1.0 unit^1.0
</str>
<str name="q.alt">*:*</str>
<str name="rows">10</str>
<str name="fl">*,score</str>
</lst>
<arr name="last-components">
<str>clustering</str>
</arr>
</requestHandler>
我最好的猜测是,胡萝卜没有正确与一起沃金edismax(Solr 1.4.1没有实现),但这可能会导致误解。
我已经将我的数据重新编制索引,以确保这不是问题。
在胡萝卜工作台集群与Lingo作为算法很好地工作。当我选择“按来源”时,我得到了xml中的“其他主题”。可能Lingo配置不好?必须配置solrconfig.xml以外的任何东西来解决这个问题吗?
我很感激任何帮助。
谢谢你的问题真的是我的 “自动完成” attbibute这是一个tokken。我现在使用一个不同的,一切都很好。 – user523859