2017-08-03 56 views

回答

0

K均值是一个随机算法。它不保证找到最佳。

所以你只是有一个不好的随机。

0

是的。见Anony-Mousse的回答。

如果您使用kmeans()函数的nstart = 25参数,那么您将运行该算法25次,让R从每次运行收集错误度量并在内部构建平均值。这样你就不需要构造一个foreach循环。

从的文档开发的kmeans()

## random starts do help here with too many clusters 
## (and are often recommended anyway!): 
(cl <- kmeans(x, 5, nstart = 25)) 

必须选择n开始一个合理的值。然后,由不同的随机初始化产生的错误更有可能被平均化。 (但是不能保证在nstart运行后tot.withinss是最小的。)