2017-10-11 53 views
0

我正在使用carrot2的STC(后缀树聚类)算法对一堆文档进行聚类。默认情况下,算法形成的最大群集数为。有没有办法决定生成的集群数量?确定在Carrot2中的簇大小设置

以下是调用STC群集的代码。

ProcessingResult byDomainClusters = controller.process(documents, null, STCClusteringAlgorithm.class); 
List<Cluster> clustersByDomain = byDomainClusters.getClusters(); 
ConsoleFormatter.displayClusters(clustersByDomain); 

回答

1

为了获得更多的集群,尝试增加maxClustersmaxBaseClusters参数的值。以下是如何pass parameter values in Java code

但是,数量较少的群集也可能是由输入数据的特征造成的(文档太少?)。要验证这一点,请尝试使用Lingo算法对数据进行聚类。