2016-03-05 194 views
0

所以我想通过使用for循环在数据框的几列上操作一个函数。R错误:参数意味着不同的行数

z <- function(x) gsub("[^\\.\\d]", "", x, perl = TRUE) 
data <- cbind(data[1:2], for(i in seq(3, 9)) {y(data[[i]])}) 

我一直运行到错误作为主题

arguments imply differing number of rows 

在我的所有列的行数相同提到。

我试着用lapply做这件事,但它虽然起作用,但它将我应用函数的列类型转换为因子。这些列是数字值,但最初从文件中读取为字符(它们存储为这样)。所以当我尝试使用lapply后转换为数字,我得到的数量级别作为输出(比如,1,2,3 ...)

任何建议,使用for循环或lapply都是受欢迎的。提前致谢。

> dput(head(data,3)) 
structure(list(MCF.Channel.Grouping = structure(c(6L, 6L, 6L), .Label = c("(Other)", 
"Direct", "Display", "Email", "Organic Search", "Paid Search", 
"Referral", "Social Network"), class = "factor"), Device.Category = structure(c(2L, 
1L, 3L), .Label = c("desktop", "mobile", "tablet"), class = "factor"), 
Spend = c("A$503,172.17", "A$375,940.43", "A$92,560.94"), 
Clicks = c("1,545,416", "1,037,740", "291,314"), Impressions = c("7,328,657", 
"3,787,612", "1,178,508"), Data.Driven.Conversions = c("1,697,814.32", 
"1,540,810.43", "430,738.63"), Data.Driven.CPA = c("A$0.30", 
"A$0.24", "A$0.21"), Data.Driven.Conversion.Value = c("A$12,815,842.66", 
"A$13,883,073.58", "A$3,804,800.15"), Data.Driven.ROAS = c("2547.01%", 
"3692.89%", "4110.59%")), .Names = c("MCF.Channel.Grouping", 
"Device.Category", "Spend", "Clicks", "Impressions", "Data.Driven.Conversions", 
"Data.Driven.CPA", "Data.Driven.Conversion.Value", "Data.Driven.ROAS" 
), row.names = c(NA, 3L), class = "data.frame") 
+0

为什么这个data.table/dplyr相关? – Arun

+0

我建议你从工作区发布对象数据的'dput' – jangorecki

+0

对不起,删除这些标签。我在同一个窗口中输入了另一个问题,与dplr相关,但后来我发现了这个问题。 –

回答

0

我们可以使用

data[-(1:2)] <- lapply(data[-(1:2)], z) 

功能是在不属于第一或第二列运行。输出分配给数据中的相同子集。

原始方法不起作用,因为for循环不会导致保存的输出。请尝试将其保存为一个变量:

x <- for(i in seq(3, 9)) {z(data[[i]])} 
x 
NULL 

即使我们保存了循环的内容,没有被抓获。循环运行然后抛弃结果。要了解循环如何工作,我们可以在以下位置指定值:

for (i in 3:9) data[,i] <- z(data[,i]) 
相关问题