我找过类似的线程,但找不到解决方案。由R中的新变量排列
我已经按载体分组了以下数据集,并创建了新变量以成功查看平均延迟时间和总延迟时间。现在我只想通过avg delay来安排数据,但是当我将下面的代码放入其中时,将为每行返回相同的数据。任何人都可以帮我弄清楚我出错的地方吗?
使用dplyr包,数据集是 “航班”,已经利用筛选出的NA值:
filter(!is.na(dep_delay), !is.na(arr_delay)).
我从这个资源http://r4ds.had.co.nz/transform.html#exercises-11
bycarrier %>%
transmute(
arrsum = sum(arr_delay),
arravg = mean(arr_delay),
depsum = sum(dep_delay),
depavg = mean(dep_delay)
) %>%
arrange(desc(arravg))
第5.6.7数据和锻炼; Tibial
退货:
Adding missing grouping variables: `carrier`
Source: local data frame [327,346 x 5]
Groups: carrier [16]
carrier arrsum arravg depsum depavg
<chr> <dbl> <dbl> <dbl> <dbl>
1 F9 14928 21.9207 13757 20.20117
2 F9 14928 21.9207 13757 20.20117
3 F9 14928 21.9207 13757 20.20117
4 F9 14928 21.9207 13757 20.20117
5 F9 14928 21.9207 13757 20.20117
6 F9 14928 21.9207 13757 20.20117
7 F9 14928 21.9207 13757 20.20117
8 F9 14928 21.9207 13757 20.20117
9 F9 14928 21.9207 13757 20.20117
10 F9 14928 21.9207 13757 20.20117
# ... with 327,336 more rows
检查顺序()或排序() –
欢迎StackOverflow上。请花时间阅读这篇文章[如何提供一个很好的R例子](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)以及如何提供[最小,完整和可验证的示例](http://stackoverflow.com/help/mcve)并相应地修改您的问题。 [如何提出一个好问题](http://stackoverflow.com/help/how-to-ask)上的这些技巧也可能有用。 – lmo
order()和sort()返回以下错误:排序错误(。,arravg):对象'arravg'找不到 – ogriofac