dplyr

54热度

2回答

我有两个数据帧，我想要使用dplyr加入。一个是包含名字的数据框。 test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) 其他数据框包含清理版本的Kantrowitz名称语料库，用于标识性别。下面是一个小例子： k

2热度

1回答

按组拉伸行间汇总值

在使用R时，我经常感兴趣的是对data.frame执行操作，其中我根据组汇总变量，然后希望将这些汇总值添加回数据。帧。 myDF <- data.frame(A = runif(5), B = c("A", "A", "A", "B", "B")) myDF$Total <- with(myDF, by(A, B, sum))[myDF$B] myDF$Proportion <- with(m

1热度

1回答

传承ddply分裂的当前值功能

这里是我想的名字的性别编码随着时间的推移一些样本数据： names_to_encode <- structure(list(names = structure(c(2L, 2L, 1L, 1L, 3L, 3L), .Label = c("jane", "john", "madison"), class = "factor"), year = c(1890, 1990, 1890, 1990, 18

2热度

3回答

如何R中

展开的大数据帧我有一个数据帧 df <- data.frame( id = c(1, 1, 1, 2, 2, 3, 3, 3, 3, 4), date = c("1985-06-19", "1985-06-19", "1985-06-19", "1985-08-01", "1985-08-01", "1990-06-19", "1990-06-19", "1990-

3热度

1回答

使用dplyr创建虚拟变量

我试图做使用dplyr如下因素：假设你有data.framey和你想的基础上var1 y <- data.frame(var1 = rnorm(100)) y$var2 <- 0 y$var2[y$var1 > 0.5] <- 1 值来创建一个新的变量是否可以使用dplyr的mutate和filter来做到这一点？

1热度

1回答

dplyr：按组分组操作具有多个参数的函数

使用robCompositions包，我需要在组的基础上推算缺失值。例如，使用虹膜数据集。 library(robCompositions) library(dplyr) data(iris) # Insert random NAs for (i in 1:4) { n_NA = sample(0:10, 1) index_NA = sample(1:nrow(iri

2热度

1回答

在R中没有循环的绑定

我可以使用循环来回答这个问题，我想不用（最好在dplyr或plyr中）。我有一个数据帧和国家的名单 Data <- data.frame( Date = c(2012:2014,2014,2013:2014), Value = rnorm(6), ) Countries <- c("AUS","USA","UK") 数据帧看起来像这样 Date Value 1 2

4热度

1回答

大规模唯一值的工作（for循环，应用或plyr）

我不知道这是可能的，但如果它是，它将使生活是如此的效率高得多。普遍的问题，这将是有趣的更广泛的SO社区：for循环（和碱功能类似于申请）适用于一般/一贯作业，如添加X到的数据帧的每列或行。我有一个普通/一致的操作我要执行，但对于数据帧中的每个元素的独特值。有没有办法比子集化我的数据帧的每一个分组，应用相对具体的数字的函数来分组，然后重新组合更有效地做到这一点？我不在乎它是否为for循环或适用，

0热度

1回答

一个数据帧的传递两列pwr.t.test

我想通过以下对pwr.t.test： > twelve fail sampsize sd 1 0.047619 21 0.9759 2 0.000000 28 0.0000 3 0.000000 1 0.0000 4 0.000000 13 0.0000 5 0.000000 1 0.0000 6 0.000000 1 0.0000 7 0.000000

17热度

1回答

dplyr：如何将do（）应用于group_by的结果？

我想使用dplyr将一个表按一列分组，然后将函数应用于每个组的第二列中的一组值。例如，在下面的代码示例中，我想返回每个人所吃的食物的2项组合。我无法弄清楚如何在do()功能中正确提供功能和正确的色谱柱（食品）。 library(dplyr) person = c('Grace', 'Grace', 'Grace', 'Rob', 'Rob', 'Rob') foods = c('apple