2015-04-22 14 views
1

我正在使用metaNMDS来探索正在使用的多变量数据集。我已经通过一个有6个级别的感兴趣的因素来限制数据集。该排序正在一个bray-curtis不相似的矩阵上运行,不是自动转换的,有2个维度(或轴),并且被设置为运行最多300次迭代。这些省略基于95%的置信度并使用SE。解读ordiellipise NMDS

NMDS解决了大约10-15次迭代,并具有良好的压力差值(15-18)。当我用ordiellipse绘制数据以可视化哪些级别可能不同时,我感到数据的实际内容几乎不存在于置信椭圆内。有人可以解释这个吗?这仅仅是一种遗产,并不能很好地适应数据;没有捕获二维数据集中固有的变化?

有什么想法?我的声望还不够高,无法发布情节图片,但如果我遇到了一些颠簸,我可以发送一张。

回答

1

您正在为的平均值(组质心)绘制置信椭圆,它告诉您如果您多次重复数据收集时可能会看到的平均值(质心)的抽样分布。换句话说,在您收集的数据样本中,您正在查看总体均值(质心)估计的不确定性。

另一种类型的置信椭圆是基于标准偏差。这是衡量数据传播的一种方法(而不是平均值),因此如果您切换到该类型,您的置信度椭圆应该没有那么令人惊讶的覆盖率。

请注意,这与人们在讨论标准差和描述统计中平均值的标准误时存在的误解是一样的。

+0

谢谢加文。出于某种原因,在描述性统计数据中没有将其视为与SD/SE类似的情况。很有帮助。 – outside842