此问题是对StackOverflow问题的扩展,要求并回答了here。有效计算数据帧列的百分位数
我的情况不同,因为我想计算50,000(或更多!)值向量中每个值的百分位数。例如 -
df <- data.frame(val = rnorm(n = 50000, mean = 50, sd = 20))
df$val.percentile <- sapply(X = df$val, function(x) ecdf(df$val)(x))
head(df)
是否有一种很好的方法来优化计算每个值的百分位数的过程?基本上我想尽可能地提高效率,因此运行时间尽可能小。
这个答案与我的不同吗? –
@ 42-它不是,但你和巴克几乎同时发布(巴克是第一个) – Jaap
呵呵,当我发布(或正在做我的编辑)时没有看到它。我假设它迟到了。 –