2011-06-28 25 views
0

据说从Solr 3.2发布以来,Carrot与Solr的集成得到了改进,但对我来说却是不同的。我有一个绝对相同的可配置的Solr 1.4.1服务器,运行的是Carrot工作良好,Solr 3.2只给了我“其他主题”。这让我疯狂,因为我没有得到任何例外或任何不寻常的东西。即使结果XML看起来是一样的...Solr3.2 Carrot2除了“其他主题”聚类

但是我没有做了许多修改,聚类组件的标准配置:

<searchComponent name="clustering" 
        enable="${solr.clustering.enabled:true}" 
        class="solr.clustering.ClusteringComponent" > 
    <lst name="engine"> 
     <str name="name">default</str> 

     <str name="carrot.algorithm">org.carrot2.clustering.lingo.LingoClusteringAlgorithm</str> 

     <str name="LingoClusteringAlgorithm.desiredClusterCountBase">20</str> 
      <!--custom--> 
     <str name="LingoClusteringAlgorithm.phraseLabelBoost">8.00</str> 
     <str name="TermDocumentMatrixBuilder.titleWordsBoost">6.00</str> 


     <str name="carrot.lexicalResourcesDir">clustering/carrot2</str> 

     <str name="MultilingualClustering.defaultLanguage">ENGLISH</str> 
    </lst> 
    <lst name="engine"> 
     <str name="name">stc</str> 
     <str name="carrot.algorithm">org.carrot2.clustering.stc.STCClusteringAlgorithm</str> 
    </lst> 
    </searchComponent> 
    <requestHandler name="/clustering" 
        startup="lazy" 
        enable="${solr.clustering.enabled:true}" 
        class="solr.SearchHandler"> 
    <lst name="defaults"> 
     <bool name="clustering">true</bool> 
     <str name="clustering.engine">default</str> 
     <bool name="clustering.results">true</bool> 
     <str name="carrot.title">autocomplete</str> 
     <str name="carrot.url">autocomplete</str> 
     <str name="carrot.snippet">autocomplete</str> 
     <bool name="carrot.outputSubClusters">true</bool> 

     <str name="defType">edismax</str> 
     <str name="qf"> 
      text^0.5 autocomplete^1.2 ata^1.0 raum^1.0 system^1.0 assy^1.0 unit^1.0 
     </str> 
     <str name="q.alt">*:*</str> 
     <str name="rows">10</str> 
     <str name="fl">*,score</str> 
    </lst>  
    <arr name="last-components"> 
     <str>clustering</str> 
    </arr> 
    </requestHandler> 

我最好的猜测是,胡萝卜没有正确与一起沃金edismax(Solr 1.4.1没有实现),但这可能会导致误解。

我已经将我的数据重新编制索引,以确保这不是问题。

在胡萝卜工作台集群与Lingo作为算法很好地工作。当我选择“按来源”时,我得到了xml中的“其他主题”。可能Lingo配置不好?必须配置solrconfig.xml以外的任何东西来解决这个问题吗?

我很感激任何帮助。

回答

3

如果您尝试集群的'snippet'永远不会相差甚至相差很小,就会发生这种情况。尝试将'clustering.snippet ='添加到您的请求参数中。在您的设置中有一个名为“autocomplete”的字段,它默认为。这个领域是否有任何有意义的文本?

实例,使这种行为走开我:

http://localhost:8983/solr/clustering?q=peter&rows=200&carrot.snippet=summary

最好的问候,

/彼得·w^

+0

谢谢你的问题真的是我的 “自动完成” attbibute这是一个tokken。我现在使用一个不同的,一切都很好。 – user523859