2015-09-17 32 views
0

我有混合数据类型矩阵Data_string大小(947 x 41)包含数字和分类属性。使用差异矩阵的分层聚类R

我用Rstudio中的daisy()函数和Gower距离度量生成了一个距离矩阵(947 x 947)。

d <- daisy(Data_String, metric = "gower", stand = FALSE,type = list(symm = c("V1","V13") , asymm = c("V8","V9","V10"))) 

我应用了使用不相似矩阵(d)的层次聚类。

# hclust 
hc <- hclust(d, method="complete") 
plot(hc) 
rect.hclust(hc, 4) 
cut <- cutree(hc, k = 1:5) 
View(cut) 

#Diana 
d_as <- as.matrix(d) 
DianaCluster <- diana(d_as, diss = TRUE, keep.diss = TRUE) 
print(DianaCluster) 
plot(DianaCluster) 

以下是我的情节。

Diana_plot

hclust_plot

**注:我不能在这里上传的图片,因为我没有足够的声誉的点。

我努力理解的结果,任何人都可以请

1-认为我在R中可以适用于简化我的结果的理解任何解决方案。

2-如何我可以,因为所有的结果都是基于相似矩阵将其链接到我的源数据。

+0

阅读关于聚类方法的书吗?或者查看[此链接](http://www.stat.berkeley.edu/~s133/Cluster2a.html)或[this](http://iasri.res.in/ebook/win_school_aa/notes/cluster_analysis_usingr.pdf )让你开始。 – ekstroem

+0

非常感谢你,我意识到情节会因理解而混乱,所以我使用“cutree”函数来获取集群列表而不是树状图。 – user3895291

回答