2014-11-14 130 views
-3

我是新来的R和具有含3种状态(1,2,3)的列的数据集。问题是我不知道用相应的虚拟变量拆分数据集以创建箱形图并最终形成线性模型。 PLease help !! :'(创建虚拟变量的数据集

+1

我想补充一个重复的例子,并且所需的输出,如果我是你... –

回答

1

所以我认为你可以指定哪些功能是绝对 说

data<- read.csv(filename) 
data$feature <- factor(data$feature) 

其中feature是要转换到分类数据的功能

是你在找什么?呢?

+0

不完全是,我将如何组步骤后的数据来创建3条不同的箱线图? – Andre

+0

我认为我需要与各个因素来遍历数据集记 – Andre

-2

如果我得到你的问题,你有2列,其中一个因子水平(1,2,3)在你的榜样,而另一个响应变量。有没有呢?(一个例子您的数据的一部分会是非常有用的)。无论如何,如果你的数据h作为这种结构,你不需要分割它。对于一个箱线图只是运行

boxplot(data$variable~data$factor) 

您可以使用同样的方法为一个线性模型:

lm(data$variable~data$factor) 

如果你的数据有其他的结构,你需要解释它以前有人可以给进一步的帮助。 ..

+0

感谢名单为,但​​是否也能帮助我找到的日常率最合适的模型,给出这组数据。 [1]:HTTPS:?//docs.google.com/spreadsheets/d/1VOq-Dp4fS5xJ8LSfmkXw8VnHGs6Of9F9F6gxTVq0sPA/edit USP =共享 – Andre