我做中的R k均值聚类有两个要求:如何指定R中kmeans的距离度量?
我需要用户自己指定距离的功能,现在它的Pearson相关系数。
我想要使用群组成员的平均值作为质心的群集,而不是一些实际的成员。 这个要求的原因是我认为使用平均值作为质心比使用实际成员更有意义,因为成员总是不在真实质心附近。如果我对此有错,请纠正我。
首先我试过kmeans
功能stat
包,但此功能不会允许自定义距离法。
然后我发现pam
函数在cluster
包中。 pam
函数允许通过以dist
对象为参数来允许自定义距离度量,但在我看来,通过这样做,它将实际成员作为质心,这不是我所期望的。因为我不认为它可以用距离矩阵完成所有的距离计算。
那么在R中做一些简单的方法来完成满足我的要求的kmeans聚类?
你可以用'素食主义者:: designdist'创建自己的指数(见'素食主义者:: vegdist'如果它已经存在)。获得'dist'对象后,可以在stats包中使用'hclust'来使用适当的聚合方法。 –
@RomanLuštrik,感谢评论。我知道如何用hclust指定距离度量,但现在我需要知道如何用kmeans来完成。 –