-1
我是R
的新手,对lm()
函数有疑问。我有一个柱Ratings
其范围内的连续的属性0到5当我调用lm()
命令为:lm in R - 用于表示连续值预测变量的表面上的分类值
lm(some_overall_rating ~ Rating, data = Ratings)
我得到的输出等:
我的问题是为什么我有这么多系数?我理想地为ratings$rating
专栏寻找一个合作效率。
我是R
的新手,对lm()
函数有疑问。我有一个柱Ratings
其范围内的连续的属性0到5当我调用lm()
命令为:lm in R - 用于表示连续值预测变量的表面上的分类值
lm(some_overall_rating ~ Rating, data = Ratings)
我得到的输出等:
我的问题是为什么我有这么多系数?我理想地为ratings$rating
专栏寻找一个合作效率。
您的评分正在被视为factor
变量。如果您运行
class(ratings$rooms_rating)
它将返回factor
。要转换为数字变量,请尝试以下操作(具体取决于dplyr
和readr
包)。
ratings = ratings %>%
mutate(rooms_rating = parse_number(rooms_rating))
现在,重新运行你的模型。
注意'lm'输出中的'NULL'。他们可能必须首先处理。 –
请查阅'factor'的'R'帮助页面。 – whuber
在'rooms_rating'列中的某处,您有一个字符'NULL'。当您导入数据时,该列将被转换为“因子”。你会想(可能)想将NULL值转换为NA值(缺失值),然后转换为数字值。 –
有点困惑,为什么你有'评级'作为你的回归,但输出结果是'收视率$ rooms_rating2','收视率$ rooms_rating3'等。不应该是'Rating2','Rating3','Rating4 '等等?你确定这是你的代码'lm(some_overall_rating〜Rating,data = Ratings)'的输出吗? – useR