我已经玩了dplyr
一点,真的很喜欢它。我虽然失去了一些东西。在plyr
中,我能够将一个函数传递给ddply
并重用它。dplyr和可重复使用的参数列表
library('dplyr')
library('plyr')
fn = function(df) {
summarise(df,
count = length(id))
}
ddply(DF1,'group', fn)
ddply(DF2,'group', fn)
所以我能将录音多个数据集的一个长长的清单,而不复制所有的参数summarise
。在dplyr
,但是,我必须这样做
dplyr::summarise(group_by(DF1,group),
count = length(id))
dplyr::summarise(group_by(DF2,group),
count = length(id))
所以参数summarise
每次都重复。 list('.data'=DF1,'count'=length(id))
和do.call
参数列表不起作用,因为length(id)
在我定义参数列表时进行评估。有没有解决方案?
为什么你有很多小数据框而不是一个大数据框? – hadley