1
我在我的数据集上做了聚类,并且它工作到目前为止。ggplot在k表示聚类后的R绘图
现在我要绘制的聚类和与此代码:
ggplot(mydata, aes(SalesRank, PageRank, colour= booksCluster$cluster))+ geom_point()
我得到这样的结果:
现在我想,而不是簇数第三列我的原始数据集(例如'XY')。
我该如何做到这一点?
编辑:
这里是我的数据
$ SalesRank: int 18083 9284 15794 14630 -1 23395 12095 991 653 33717 ...
$ PageRank : num 0.01 0.01241 0.00753 0.00454 0.00301 ...
$ Verlag : Factor w/ 58 levels "-1TION-Z","A-1conda",..: 40 33 33 33 33 57 33
对不起,我对r完全陌生,不理解你的建议。 – moses
@NicoHoppel阅读更多关于因素[这里](https://www.stat.berkeley.edu/classes/s133/factors.html)和[here](http://stackoverflow.com/questions/29711067/r-如何对变化名称的因子的水平)。 –
啊好吧,我明白了。现在我必须输入20个名称作为矢量? – moses