2016-09-21 19 views
-4

我的要求是找到Co-RelationE_Id, IncomeType and Tax以帮助理解是否有任何E_Id, IncomeType总是导致更高的Tax。我需要的列的示例数据是查找R中多个列的相关性

E_id   IncomeType     Tax 
1     1     121 
2     1     11.23 
2     3     51.623 
1     1     115.23 
3     4     675.1 

我有大约5个lacs数据,4种类型的IncomeType,340个唯一的E_id。我分组的数据,现在我的数据看起来像这样:

E_Id Tax_Income_1 Tax_Income_2 Tax_Income_3 Tax_Income_4 
1   118025   66513.25   148134  274072.16 
2   200527   235278   247536.42  487333.98 
3   3376.93   11279    114312.5  130463.97 
4   44630   22285.95   20830.55  2375 
5   42902.63   15649    7602.01  3624 

现在我不知道如何找到相关性。这是我的第一个分析项目,请提供一些指导。

回答

0

使用mtcars数据集作为一个例子可以可视化的所有变量的相关性是这样的:同样使用mtcars数据集作为一个例子

data(mtcars) 
pairs(mpg ~ ., data = mtcars) 

enter image description here

1

,该COR()结将产生可变相关矩阵。

data(mtcars) 
cor(mtcars) 

您也可以用图形表示这些相关性:

corrgram(mtcars) 

enter image description here