我必须将我的人口聚类在8 clusters
。我正在使用proc fastclus
和k-means
方法(以最小化群集之间的差异)。观察结果代表一个分数,所以即使在聚类过程之后,它们仍然是有序的。我注意到这样:使用proc fastclus(SAS)维护意见订购的K-means聚类
proc sort data=input.population;
by score;
run;
proc fastclus data = input.population
maxclusters = 8 list
out = score_clus
converge = 0.01 maxiter = 100
least = 2 noprint;
var score;
run;
程序没有维护顺序。有一种方法(可能是proc的一个参数),我可以使用另一种方法:最小化方差,但保持集群内排序的分数。