2016-12-13 15 views
-1

我是R的新手,对lm()函数有疑问。我有一个柱Ratings其范围内的连续的属性0到5当我调用lm()命令为:lm in R - 用于表示连续值预测变量的表面上的分类值

lm(some_overall_rating ~ Rating, data = Ratings) 

我得到的输出等:

enter image description here

我的问题是为什么我有这么多系数?我理想地为ratings$rating专栏寻找一个合作效率。

+2

请查阅'factor'的'R'帮助页面。 – whuber

+0

在'rooms_rating'列中的某处,您有一个字符'NULL'。当您导入数据时,该列将被转换为“因子”。你会想(可能)想将NULL值转换为NA值(缺失值),然后转换为数字值。 –

+0

有点困惑,为什么你有'评级'作为你的回归,但输出结果是'收视率$ rooms_rating2','收视率$ rooms_rating3'等。不应该是'Rating2','Rating3','Rating4 '等等?你确定这是你的代码'lm(some_overall_rating〜Rating,data = Ratings)'的输出吗? – useR

回答

2

您的评分​​正在被视为factor变量。如果您运行

class(ratings$rooms_rating) 

它将返回factor。要转换为数字变量,请尝试以下操作(具体取决于dplyrreadr包)。

ratings = ratings %>% 
    mutate(rooms_rating = parse_number(rooms_rating)) 

现在,重新运行你的模型。

+0

注意'lm'输出中的'NULL'。他们可能必须首先处理。 –

相关问题