2016-08-03 64 views
-2

我用hclust来聚簇我的数据和cutree指定的群集数为3.有没有什么办法可以检查每个群集?通过检查,我的意思是列出例如在第一个集群。我尝试了所有我知道的基本功能,例如summary(),list() ...但似乎不相关。任何函数都可以这样做?在R中的聚类

如果不是,cutree函数返回组/集群的列表,每个我的观察是属于,是这样的:

1,3,1,2,3,3,1

这表明我的第一次观察属于第1组,第二次属于第三组... 我在考虑如何从列表中提取位置,例如group = 1,所以它会返回1,3和7,因为观察1,3,7属于group 1

或者我需要使用一个循环来计算属于例如该列表中的第1组?

我的问题清楚了吗?

+0

有人帮忙吗? – BigData

+0

不是你的问题不是很清楚,而是试图回答。您可以使用cutree函数中的列表:1,3,1,2,3,3,1,您可以使用此数组对您的原始数据框进行子集或分组,以便检查各个集群。供参考:提供一个例子(数据和输出在这个论坛获得帮助很长的路要走。 – Dave2e

+0

我做到了,谢谢大家! – BigData

回答

0

这是一个提示,而不是答案。以下是Hierarchical Clustering in R的示例。您可以尝试使用功能table(),ggplot()以查看每个群集的观察值。

0

这是否有助于开始?

nclust <- 10 

cutreeout <- cutree(hclustOutput, nclust) 

作为新列添加到您的数据帧

mydata$cluster <- cutreeout 

有多少个观察在每个集群?

table(mydata$cluster) 

然后你可以做更多的事情来解释你的集群,和/或研究你的数据的子集。