3

在R中的pvclust包中,有pvclust()函数。在功能帮助文件中提供的示例中,有以下功能:有人可以解释R中pvclust函数的输出吗?

boston.pp <- pvpick(boston.pv) 

这应该打印出具有高p值的群集。这个函数的输出是:

$clusters 
$clusters[[1]] 
[1] "rm" "medv" 

$clusters[[2]] 
[1] "zn" "dis" 

$clusters[[3]] 
[1] "crim" "indus" "nox"  "age"  "rad"  "tax"  "ptratio" "lstat" 


$edges 
[1] 3 5 9 

我很难理解输出的含义,尤其是因为我对聚类分析的技术背景非常有限。特别是,我不明白每个群集下的名称向量的含义。有人可以为我解释吗?谢谢!

回答

0

https://cran.r-project.org/web/packages/pvclust/pvclust.pdf 描述pvclust:

对于表示为数据为(N×P)矩阵或数据帧,我们假定数据为p对象,将被集群的N个观测。的第i行矢量对应于这些对象的第i个观察和第j列向量对应于第j个对象物的样品与大小为n

输出pvpick的:

cluster - 字符串向量列表。每个矢量对应于每个群集中对象的名称。

您是否绘制了pvclust输出的树状图? pvpick clusters输出只列出了内部点(pvclust将波士顿数据集中的每个作为一个点),在某些聚类中,如果绘制它,您将在树状图中看到它。 enter image description here

+0

确实是pvclust集群变量和hclust集群观察? – xyy

+0

@xyy,是的,你可以尝试boston.hc < - hclust(dist(波士顿))确定这一点。 –

相关问题