我想预测一个数值变量。我有几个因素。对于所有这些因素,我有一个数字等值。现在,将这个数值等同于该因子并将其用于预测是完美的。这可能吗? 如果这是不可能的,我想我将需要用它们的数值替换这些因素。最好的办法是什么?给出因子数值[R]
一个例子:
df = data.frame(f=c("a","b","a","c"),v=c(2,4,2,6))
lookup = data.frame(name=c("a","b","c"),v=c(1,2,3))
我想获得
df2 = data.frame(f=c(1,2,1,3),v=c(2,4,2,6))
cor(df2$f,df2$v) # will be 1
你的意思是,该因素的数值等同?因素是类别。当你说预测时,你是什么意思? – TARehman
R将因子视为分类变量和数值作为连续变量。这两种类型的变量往往有不同的统计方法与它们相关联,并且模型的解释因变量类型而异。你真的应该首先决定什么类型的分析适合你的数据。 – MrFlick
我增加了一个例子,使其更加清晰。这些字母就是我所得到的,查找表中的数字是我之前计算出的一些平均值,现在可以使用。 – nik