2017-07-05 35 views
3

我得到了一个关于“下标越界”的问题,我想要的是得到每个观察的第一个和最后一个月,我有三个连续的“1”或“真” 。我想创建2个新的专栏,分别是第一个月和最后一个月的“开始”和“结束”。 在我的第一个观察的例子中:开始等于avril并且等于juin 在5个观察中:开始等于fevrier并且等于avril 在9个观察中:开始等于janvier并且结束等于mars 。 ..条件和行和列与双循环

我试着这样做:

nom <- letters[1:5] 
pseudo <- paste(name, 21:25, sep = "") 
janvier <- c(0, 1, 1, 1, 0) 
fevrier <- c(1, 1, 1, 1, 1) 
mars <- c(0, 0, 0, 1, 1) 
avril <- c(1, 1, 1, 0, 1) 
mai <- c(1, 0, 1, 1, 1) 
juin <- c(1, 1, 0, 1, 0) 

df <- data.frame(nom =nom, pseudo = pseudo, janvier = janvier, 
       fevrier = fevrier, mars = mars, avril = avril, 
       mai = mai, juin = juin) 

dfm <- as.matrix(df[, -c(1, 2)]) 

my_matrix <- matrix(nrow = 10, ncol = 6) 


for(i in 1:dim(dfm)[1]){ 
    for(j in 1:dim(dfm)[2]){ 
    if(dfm[i, j] + dfm[i, j+1] + dfm[i, j+2] == 3){ 
     my_matrix[i, j] <- "periode_ok" 
     my_matrix[i, j+1] <- "periode_ok" 
     my_matrix[i, j+2] <- "periode_ok" 
    } 
    } 
} 

的输出中应该是这样的:

begin <- c("avril", "no info", "no info", 
      "janvier", "fevrier", "avril", "no info", 
      "no info", "janvier", "fevrier") 
end <- c("juin", "no info", "no info", "mars", 
     "avril", "juin", "no info", "no info", 
     "mars", "avril") 

output <- data.frame(nom =nom, pseudo = pseudo, janvier = janvier, 
       fevrier = fevrier, mars = mars, avril = avril, 
       mai = mai, juin = juin, begin = begin,end = end) 

任何帮助将apreciated

+1

'为(j在1:(暗(DFM)[2] -2))'使用此。 – Masoud

+1

'pseudo'应该是长度为5,因为所有其他变量是。 – Masoud

+0

https://stackoverflow.com/questions/25316565/return-column-index-of-first-set-of-consecutive-values-in-data-frame-row-in-r – Masoud

回答

5

首先,构建像1:dim(dfm)[1]是很危险的,因为如果dim(dfm)[1]是零,你会得到完全有效的载体1:0循环将尝试解决一个向量的元素零,或者在这种情况下,矩阵。这是非法的,会引发错误。推荐的解决方案是使用seq_len(...)。 其次,我用nrowncol而不是dim(dfm)[.]。 现在为你得到的错误。您正在设法解决j + 1j + 2列,因此当j达到ncol(dfm)时,您已退出债券。下面的代码删除了循环限制的最后两个元素。

n <- ncol(dfm) 
for(i in seq_len(nrow(dfm))){ 
    for(j in seq_len(n)[-c(n - 1, n)]){ 
    if(dfm[i, j] + dfm[i, j+1] + dfm[i, j+2] == 3){ 
     my_matrix[i, j] <- "periode_ok" 
     my_matrix[i, j+1] <- "periode_ok" 
     my_matrix[i, j+2] <- "periode_ok" 
    } 
    } 
} 

my_matrix 
3

当然还有这个矢量化的解决方案,但如果你想纠正你的for循环需要限制jdfm零下2尺寸为您提前检查两列。根据您提供的内容,这将对您有所帮助;但是,目前尚不清楚如何从5行的df得到10行(重复两次)。

 my_matrix <- matrix("no info", nrow = 5, ncol = 2) 
     colnames(my_matrix) <- c("begin", "end") 


     for(i in 1:dim(dfm)[1]){ 
     for(j in 1:(dim(dfm)[2]-2)){ 
      if(dfm[i, j] + dfm[i, j+1] + dfm[i, j+2] == 3){ 
      my_matrix[i, 1] <- colnames(dfm)[j] 
      my_matrix[i, 2] <- colnames(dfm)[j+2] 
      break 
      } 
     } 
     } 


output <- cbind(df, my_matrix) 

然后结果将是:

output 

# nom pseudo janvier fevrier mars avril mai juin begin  end 
# 1 a name21  0  1 0  1 1 1 avril juin 
# 2 b name22  1  1 0  1 0 1 no info no info 
# 3 c name23  1  1 0  1 1 0 no info no info 
# 4 d name24  1  1 1  0 1 1 janvier mars 
# 5 e name25  0  1 1  1 1 0 fevrier avril