在R中集群时发生错误

我在UCI存储库中提供的虹膜数据集上正在R工具中执行Kmeans集群。在R中集群时发生错误

下面是示例数据集：

SepalLength,SepalWidth,PetalLength,PetalWidth,Species 
5.1,3.5,1.4,0.2,Iris-setosa 
4.9,3.0,1.4,0.2,Iris-setosa 
4.7,3.2,1.3,0.2,Iris-setosa 
4.6,3.1,1.5,0.2,Iris-setosa 
5.0,3.6,1.4,0.2,Iris-setosa 
5.4,3.9,1.7,0.4,Iris-setosa

我执行以下三个命令：

iris<-read.csv("C:/Users/admin/Desktop/Experiment/t2.csv") 
View(iris) 
km<- kmeans(iris, 3)

我得到如下所示的错误：

Error in kmeans(iris, 3) : 
    more cluster centers than distinct data points. 
In addition: Warning message: 
In kmeans(iris, 3) : NAs introduced by coercion

我认为这可能是因为它是非数字的第五列Species。所以，我从数据集中删除了该列，然后再次重复上述命令。但是，我仍然遇到同样的错误。

来源

2014-04-07 r4sn4

有没有可能是你的第一个四列编码为因素或一些这样？顺便说一句，虹膜数据集是内置到R.开始一个新的R会话，并运行'kmeans（虹膜[， - 5]，3）'，这完全适合我。 –

谢谢。这个命令工作。我把这个链接称为http://www.rdatamining.com/examples/kmeans-clustering。我只是拿这个数据集进行实验。当我运行在内置于R命令的数据集上时，它运行良好。但是，不适用于我手动创建的iris.csv的命令 – r4sn4

请确保您正在聚类的数据不是“因素”。检查'str（yourdata）'看看这个。（除非你原来的问题是由其他原因引起的。） –

尝试使用这个

iris<-read.csv("C:/Users/admin/Desktop/Experiment/t2.csv", header=FALSE)

来源

2016-04-04 06:39:02

在R中集群时发生错误

回答

相关问题