我的要求是找到Co-Relation
的E_Id, IncomeType and Tax
以帮助理解是否有任何E_Id, IncomeType
总是导致更高的Tax
。我需要的列的示例数据是查找R中多个列的相关性
E_id IncomeType Tax
1 1 121
2 1 11.23
2 3 51.623
1 1 115.23
3 4 675.1
我有大约5个lacs数据,4种类型的IncomeType,340个唯一的E_id。我分组的数据,现在我的数据看起来像这样:
E_Id Tax_Income_1 Tax_Income_2 Tax_Income_3 Tax_Income_4
1 118025 66513.25 148134 274072.16
2 200527 235278 247536.42 487333.98
3 3376.93 11279 114312.5 130463.97
4 44630 22285.95 20830.55 2375
5 42902.63 15649 7602.01 3624
现在我不知道如何找到相关性。这是我的第一个分析项目,请提供一些指导。