我有两组。治疗组接触媒体;对照组不是媒体。它们通过数据框中的分类变量进行区分。 (暴露于媒体= 1,没有媒体= 0)应用k-means来检查R中两组间的差异
现在,我想检查这两个组之间是否存在明显差异。为此,将具有两个群集的k均值算法应用于四个变量(黑人人口比例,男性人口比例,西班牙裔人口比例,对数尺度中位数收入)。
如何在R中做到这一点?任何人都可以提供一些提示吗?谢谢!这里
km <-kmeans(your data, 2, nstart=10)
您的数据作为data.frame
(你的整个数据,或者你可以选择你对他们感兴趣的变量):
尝试用'?? kmeans' r中 –