2016-11-26 35 views
1

我在我的数据集上做了聚类,并且它工作到目前为止。ggplot在k表示聚类后的R绘图

现在我要绘制的聚类和与此代码:

ggplot(mydata, aes(SalesRank, PageRank, colour= booksCluster$cluster))+ geom_point() 

我得到这样的结果:

enter image description here

现在我想,而不是簇数第三列我的原始数据集(例如'XY')。

我该如何做到这一点?

编辑:

这里是我的数据

$ SalesRank: int 18083 9284 15794 14630 -1 23395 12095 991 653 33717 ... 
$ PageRank : num 0.01 0.01241 0.00753 0.00454 0.00301 ... 
$ Verlag : Factor w/ 58 levels "-1TION-Z","A-1conda",..: 40 33 33 33 33 57 33 

回答

0

你将不得不改变的booksCluster$cluster级别名称。如果这还不是一个因素,你将不得不强制它。您可以使用levels(bookClusters$cluster) <- c(...),其中...是新名称的向量。

+0

对不起,我对r完全陌生,不理解你的建议。 – moses

+0

@NicoHoppel阅读更多关于因素[这里](https://www.stat.berkeley.edu/classes/s133/factors.html)和[here](http://stackoverflow.com/questions/29711067/r-如何对变化名称的因子的水平)。 –

+0

啊好吧,我明白了。现在我必须输入20个名称作为矢量? – moses