0
我有混合数据类型矩阵Data_string大小(947 x 41)包含数字和分类属性。使用差异矩阵的分层聚类R
我用Rstudio中的daisy()函数和Gower距离度量生成了一个距离矩阵(947 x 947)。
d <- daisy(Data_String, metric = "gower", stand = FALSE,type = list(symm = c("V1","V13") , asymm = c("V8","V9","V10")))
我应用了使用不相似矩阵(d)的层次聚类。
# hclust
hc <- hclust(d, method="complete")
plot(hc)
rect.hclust(hc, 4)
cut <- cutree(hc, k = 1:5)
View(cut)
#Diana
d_as <- as.matrix(d)
DianaCluster <- diana(d_as, diss = TRUE, keep.diss = TRUE)
print(DianaCluster)
plot(DianaCluster)
以下是我的情节。
**注:我不能在这里上传的图片,因为我没有足够的声誉的点。
我努力理解的结果,任何人都可以请
1-认为我在R中可以适用于简化我的结果的理解任何解决方案。
或
2-如何我可以,因为所有的结果都是基于相似矩阵将其链接到我的源数据。
阅读关于聚类方法的书吗?或者查看[此链接](http://www.stat.berkeley.edu/~s133/Cluster2a.html)或[this](http://iasri.res.in/ebook/win_school_aa/notes/cluster_analysis_usingr.pdf )让你开始。 – ekstroem
非常感谢你,我意识到情节会因理解而混乱,所以我使用“cutree”函数来获取集群列表而不是树状图。 – user3895291