我想在R语言(编码)中对我的数据(kmeans或hclust)进行聚类。我的数据是有序的,这意味着数据是李克特量表来衡量成本升级的原因(我有41个原因“变量”),从1到5缩放,其中1对5个主要影响没有影响(我有约160观察“谁排名原因”)...如何根据观察结果聚类41任何帮助...我必须在聚类或任何帮助....之前将比例转换为百分比或z分数.... .. 我真的需要你的帮助!!这里是要玩的数据https://docs.google.com/spreadsheet/ccc?key=0AlrR2eXjV8nXdGtLdlYzVk01cE96Rzg2NzRpbEZjUFE&usp=sharing集群序数据
我想根据观察中发生的相似性聚集变量(列)......我遵循statmethods.net/advstats/cluster.html中的代码;但是我无法根据观察中发生的相似性将变量(列)聚类在一起,并且我遵循mattpeeples.net/kmeans.html#help中的工作;但我不知道他为什么会将数据转换为百分比,然后将Z值标准化。
你应该在确定你应该问你的问题之前澄清你的问题。如果这是一个统计问题,你应该去交叉验证;如果它是一个编码问题,你应该在这里问,但是我看不出有关你编码的问题。 – lokheart