2014-02-14 53 views
1

我正在使用PSPP(不是SPSS,因为我无法在我的Ubuntu机器上运行该程序)并将我的一组〜100k个记录与k-means群集集成在一起。现在我真正需要的是比每个集群有多少记录更详细的输出。我需要保存即保存群集变量/变量PSPP

行1 =>簇1

行2 =>簇4

行3 =>簇1

等...

本质群集可变我需要额外的字段来保存每条记录的结果集群关联度。我目前的语法是:

QUICK CLUSTER cat1 cat2 cat3 cat4 cat5 cat6 cat7 cat8 cat9 cat10 cat11 cat12 
/CRITERIA=CLUSTERS(12) MXITER(100000000). 

SPSS和PSPP所以如果在SPSS的选项可能在这里工作过分享了很多相同的语法。

回答

1

统计数据应在Ubuntu上运行,但统计QUICK CLUSTER命令有一个子

/攒簇

应该做你想做的。您可以选择在CLUSTER之后的括号中指定变量名称。

0

PSPP不处理/ SAVE CLUSTER子命令。 试试吧!

QUICK CLUSTER var_list 
     [/CRITERIA=CLUSTERS(k) [MXITER(max_iter)] CONVERGE(epsilon) [NOINITIAL]] 
     [/MISSING={EXCLUDE,INCLUDE} {LISTWISE, PAIRWISE}] 
     [/PRINT={INITIAL} {CLUSTER}] 

查看GNU page of PSPP