我有一个数据帧在那里我有值,并为每个值我有与该值相关联的计数。所以,根据数值绘制计数值可以得到直方图。我有三种类型,a
,b
和c
。从直方图得到计数到CDF
value counts type
0 139648267 a
1 34945930 a
2 5396163 a
3 1400683 a
4 485924 a
5 204631 a
6 98599 a
7 53056 a
8 30929 a
9 19556 a
10 12873 a
11 8780 a
12 6200 a
13 4525 a
14 3267 a
15 2489 a
16 1943 a
17 1588 a
... ... ...
我该如何从CDF中获得?
到目前为止,我的做法是超级低效的:我第一次写总结了计数到该值的函数:
get_cumulative <- function(x) {
result <- numeric(nrow(x))
for (i in seq_along(result)) {
result[i] = sum(x[x$num_groups <= x$num_groups[i], ]$count)
}
x$cumulative <- result
x
}
然后我在ddply
由式分割这个包起来。这显然不是最好的方法,我很乐意提供关于如何继续的建议。
什么'cumsum'? –