2017-09-15 82 views
-1

我的数据框在每个列/变量中有许多异常值。我使用Boxplot/IQR截断值将它们移除了75%/ 25%。我拿出每一列,并从中删除异常值。因此,每列中都有不同数量的值。现在我想将那些没有任何离群值的所有NEW变量组合到单个数据帧中。数据框中出现此错误。我该如何解决这个问题?因为,我必须在新数据框上进行逻辑回归。我尝试了cbind.data.frame,然后与rbind类似,但这并不能解决问题。Dataframe中的错误:暗示参数数目不同的参数

下面是代码:

newdata <- data.frame(finalsbp, mynewT, mynewldl,mynewtypea1, mynewobesity, mynewalcohol, age, famhist) 

Error in data.frame(finalsbp, mynewT, mynewldl, mynewtypea1, mynewobesity, : 

arguments imply differing number of rows: 447, 443, 448, 458, 454, 429, 462 

P.S.年龄和家庭主义的长度是相同的。即462

+1

我会研究在你的数据上使用merge()。请给出一些代码来创建一个最小可重复的例子,以及您的预期输出是什么。 –

+1

@RichardLusch 我想这 >合并(finalsbp,mynewT,mynewldl,mynewtypea1,mynewobesity,mynewalcohol,年龄,famhist) 错误fix.by(by.x,X): '由' 必须匹配列数 –

+0

@RichardLuschL我编辑了我的问题,你可以检查。需要帮助我的问题。如果你不能回答,那很好,但不要给-1(特别是当我做出改变时)。 –

回答

0

不知道更多关于你的数据的信息,你可以尝试使每个向量的长度相同,如this post所示。

a <- seq(from = 1, to = 10) 
b <- seq(15, 30) 
c <- seq(2, 10) 

length(a) <- n 
length(b) <- n 
length(c) <- n 

newdata <- cbind(a, b, c) 

这应该解决您的问题,假设你希望所有的空格在数据帧的结尾显示为NA。

+0

谢谢。有用。我添加了n = 500,因此制作数据帧的长度将是统一的。 –