2013-12-19 58 views
0

我想计算2个变量数组的相关性,但数组在中间脱节 - 但我试图获得一个相关系数如何求和相关,或计算脱节变量的相关性

示例;

x:1, 2, [disjointed], 5.1, 5.2, 5.3, 5.4, 5.5, 5.6 

y:2, 4, [disjointed], 9.1, 9, 8.9, 8.8, 8.7, 8.6 

见我上传的Excel文件:http://www.qfpost.com/file/d?g=1UfQx3cUj

因为在中间的不相交的,有一定程度的值的跳跃,并且当我一起关联整个组可变的我获得的相关系数这并不真正反映变量之间的关系

我将如何能够计算出一个相关系数?我可以计算两个独立的相关性,但总之有两个相关性总和?

谢谢你的先生

[编辑:格式化&还添加链接到Excel文件]

+2

可以提供代码经由荟萃分析整合他们现在计算它?什么是“脱节”? –

+0

Hi Ilya;我使用excel的= correl来计算,基本上,我有2个数组集合(称为array1和array2),我试图在array1正在下降时计算变量的相关性,并计算array1中变量的相关性增加;因为这个我在中间脱节,因为array1在中间增加,我试图在array1减少时计算相关性。希望这会有所帮助,当我回家时,我会上传我的Excel数据[编辑:句子] – user3117403

回答

0

简短的回答:看依存度比其他的相关措施。

如果我正确理解你的问题,你都在思考一个问题,即数据是这样的:

 
#R code 
N=500 
set.seed(10) 
x = rnorm(N) 
y = rnorm(N,10*x) 
plot(x,y) 
abline(reg = lm(y~x)) 
#correlation 
cor(x,y) 
[1] 0.9954706 

enter image description here

这些显然是相关的X和Y变量。

然而,你的情况看起来更像这个(显然,这是简化的显示点):

 
abs = ifelse(x>0, 10, -10) 
y2 = rnorm(N,abs*x) 
plot(x,y2) 
abline(reg = lm(y2~x)) 
cor(x,y2) 
[1] -0.01952952 

enter image description here

相关性是两个变量之间的线性关系的函数。在最上面的图像中,很明显Y很大程度上取决于X,接近1的相关性反映了线性关系。然而,在底部图像中,即使Y严重依赖于X,相关系数几乎为0(并且在非常大的样本中确实为0)。

这只是一个相关性的缺点 - 没有“修复”,可以将X和Y的相关性在X = 0之上和之下进行求和。如果您想要更好地表征数据的相关方式,请查看(例如)非线性回归技术。更好的是,与你所在机构的统计师一起工作(或者在附近找一个统计员)。在没有看到更多数据的情况下,无法确切知道您需要什么。