我有两列缺少数据。查找排除两列缺失值的观察子集
Var1 Var2
1445 40
656 NA
NA NA
607 NA
2098 15
我想计算这些列之间的相关性,同时排除缺少数据的观测值。我试图
cor(na.omit(df$Var1),na.omit(df$Var2),method="pearson")
但我得到的心病(na.omit(DF $ VAR1),na.omit
错误(DF $ VAR2): 不相容的维度
我认为这是因为,而不是采取这两个变量的交集,我越来越
Var1(NA omit) Var2(NA omit)
1445 40
656 15
607
2098
,所以没有关联可以运行,因为它改变了列的长度。
如何忽略包含NA
的所有观察值,以便列的长度相同?
'COR(na.omit(DF $ VAR1),na.omit(DF $ VAR2),方法= “皮尔森”,使用=“成对.complete.obs“)' – kaksat
但是,您可能想要阅读以下内容:[配对 - 完全关联被认为是危险的](http://bwlewis.github.io/covar/missing.html)。 –
谢谢,不知道这个。 – kaksat