2017-05-09 22 views
-2

的结果,所以我不知道是否已经被重复之前我的查询。 我对样本数据集执行k = 3的k均值聚类,算法返回所需的聚类结果。现在我想绘制第2簇的结果,以查看第2簇中的成员彼此隔开多远。我会怎么做?由于绘制我是新来的R A特定的集群

name <- sample(letters[1:25]) 
age<-sample(20:50, 25, replace=FALSE) 
salary <-sample(2000:10000, 25, replace=FALSE) 
demo<-data.frame(name, age, salary) 
set.seed(299) 
study<-kmeans(demo[,-1],centers = 3) 
+0

是的,我得到了K-MEA ns与3个大小为12,6,7的集群以及SS与SS值之间的聚类进行聚类,然后如何进行。我想这就是你要求的 – TKM

回答

0

随着ggplot()

ggplot(data=demo, 
     aes(x=age, y=salary, 
      color=factor(study$cluster))) + 
    geom_point() 

enter image description here

只显示簇2:

ggplot(data=demo[study$cluster==2,], 
     aes(x=age, y=salary)) + 
    geom_point() 

enter image description here

+0

谢谢我现在有了一个想法,但既然我只想绘制2号集群的结果,是否有办法做到这一点。我正在考虑在“研究”数据集的每个记录中附加簇号,然后过滤数据集以显示簇号为2的记录,然后进行绘图即ggplot(研究%>%过滤器(Cluster_number == 3) ,aes(x = age,y = salary, color = factor(study $ cluster))+ geom_point()除此之外还有什么办法 – TKM

+0

另外,如果我的研究数据集中有另一个连续变量, “,我想要这个变量也显示在情节除了年龄,工资,然后如何做到这一点? – TKM

+0

@TKM看到我的更新。至于你的第二个问题,我并不是很了解它。您可能会用可重现的示例发布另一个问题。 – hhh