我也一边做文本聚类在亨利马乌0.9与集群转储一个问题 -ClusterDump在亨利马乌0.9
https://mahout.apache.org/users/clustering/clusteringyourdata.html
一个簇转储的情况下,输出前k kerms和要不要t指定参数p(pointsDir)。
集群转储的第二种情况是您指定参数p(pointsDir)的位置,您可以获得与集群关联的点。
这两个输出都具有相同的确切群集标识,但情况1中显示的记录数量 - 显示的顶级条款与条件2中出现的记录数量不同 - 您获得与群集关联的点数。
为什么会发生这种情况?我的意思是它的bizzare看到与特定群集相关的不同点数,并不确定哪一个是正确的?
有没有人看到过这种情况?
预先感谢您!