2013-03-27 109 views
3

我有一个相当简单的问题,需要在matlab中寻址。我想我理解,但我需要有人澄清我正确地做到这一点:matlab相关性和重要值

在下面的示例中,我试图计算两个向量之间的相关性和相关性的p值。

dat = [1,3,45,2,5,56,75,3,3.3]; 
dat2 = [3,33,5,6,4,3,2,5,7]; 

[R,p] = corrcoef(dat,dat2,'rows','pairwise'); 
R2 = R(1,2).^2; 
pvalue = p(1,2); 

从这我有一个R2值为0.11和p值为0.38。这是否意味着矢量相关系数为0.11(即11%),并且预计这将出现相同的38%,因此62%的时间会出现不同的相关性?

回答

4
>> [R,p] = corrcoef(dat,dat2,'rows','pairwise') 

R = 

    1.0000 -0.3331 
    -0.3331 1.0000 


p = 

    1.0000 0.3811 
    0.3811 1.0000 

相关性为-0.3331,p值为0.3811。后者是当真实相关性为零时,通过随机机会获得-0.3331相关性的概率。 p值很大,所以我们不能拒绝在任何合理的显着性水平上不相关的零假设。

3

相关系数这里是

r(1,2) 
ans = 
    -0.3331 

这是-33.3%,它告诉你的是,两个数据集是负线性相关的相关性。您可以通过绘制他们看到这一点:

plot(dat, dat2, '.'), grid, lsline 

enter image description here

相关的p值

p(1,2) 
ans = 
    0.3811 

这就告诉你,即使有没有两个随机之间的相关性变量,那么在9个观测的样本中,您将会看到至少与极端相关的相关性约为-33.3%,时间约为38.1%。

通过至少和我一样极端我们的意思是,样本中测量的相关性低于-33.3%,或高于33.3%。

鉴于p值如此之大,您无法可靠地得出关于是否应拒绝零相关零假设的结论。