add_row与group_by巢弼

我想add_row（）分组数据没有使用做。add_row与group_by巢弼

library(dplyr) 
library(tidyr) 
library(purrr) 
library(tibble) 


my.data <- data.frame(

    supplier = c("a","a","a","a","a","a","b","b","b","b","b","b"), 
    date = rep(c("2017-06-01","2017-03-01","2017-02-01","2017-01-12", 
       "2017-05-01","2017-04-01"), 2), 
    order = c(1,0,0,1,1,0,0,1,0,0,1,0) 

)

用做

my.data %>% 
    group_by(supplier) %>% 
    do(add_row(.,.before=0))

解决这给

# A tibble: 14 x 3 
# Groups: supplier [3] 
    supplier  date order 
     <chr>  <chr> <dbl> 
1  <NA>  <NA> NA 
2  a 2017-06-01  1 
3  a 2017-03-01  0 
4  a 2017-02-01  0 
5  a 2017-01-12  1 
6  a 2017-05-01  1 
7  a 2017-04-01  0 
8  <NA>  <NA> NA 
9  b 2017-06-01  0 
10  b 2017-03-01  1 
11  b 2017-02-01  0 
12  b 2017-01-12  0 
13  b 2017-05-01  1 
14  b 2017-04-01  0

尝试巢和变异或purrr ::地图

my.data %>% 
    group_by(supplier) %>% 
    nest() %>% 
    mutate(extra.row = add_row(data, .before = 0))

mutate_impl（.data，dots）中的错误：评估错误：不支持的索引类型：NULL。

有任何建议。缩放时，速度非常慢。

来源

2017-08-11 iboboboru

你想整行是NA，甚至分组VAR（S）？ – Frank

意图是add_row的日期值是每组最短日期之前的30天。 add_row（数据，日期=（分钟（。$日期） - 30），.before = 0） – iboboboru

好吧，加入应该这样做，我猜。我不使用全反，所以不能作出答案。您应该澄清一下，问题中的“带解决方案”不是解决方案（因为供应商和日期不适用）。？ – Frank

您可以很容易地将汇总数据集绑定到原始数据集上。您也可以使用complete，但现在每个组的日期都是相同的，并且可能不适用于每个组的不同日期。另外，我认为complete在放大时趋于缓慢。

这两种解决方案都取决于date是原始数据集中的实际date变量。

my.data = mutate(my.data, date = as.Date(date))

总结，并与summarize和bind_rows结合。 arrange是为了让事情有序，在实际情况下可能不需要。

my.data %>% 
    group_by(supplier) %>% 
    summarize(date = min(date) - 30) %>% 
    bind_rows(., my.data) %>% 
    arrange(supplier, date)

如果组间的日期相同，则使用complete。

my.data %>% 
    group_by(supplier) %>% 
    complete(date = c(min(.$date) - 30, .$date)

结果两个：

# A tibble: 14 x 3 
# Groups: supplier [2] 
    supplier  date order 
    <fctr>  <date> <dbl> 
1  a 2016-12-13 NA 
2  a 2017-01-12  1 
3  a 2017-02-01  0 
4  a 2017-03-01  0 
5  a 2017-04-01  0 
6  a 2017-05-01  1 
7  a 2017-06-01  1 
8  b 2016-12-13 NA 
9  b 2017-01-12  0 
10  b 2017-02-01  0 
11  b 2017-03-01  1 
12  b 2017-04-01  0 
13  b 2017-05-01  1 
14  b 2017-06-01  0

来源

2017-08-11 16:07:04 aosmith

我喜欢bind_rows（）的答案。它会为我所需要的工作。感谢您的帮助，非常感谢。 – iboboboru

add_row与group_by巢弼

回答

相关问题