dplyr

    54热度

    2回答

    我有两个数据帧,我想要使用dplyr加入。一个是包含名字的数据框。 test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) 其他数据框包含清理版本的Kantrowitz名称语料库,用于标识性别。下面是一个小例子: k

    2热度

    1回答

    在使用R时,我经常感兴趣的是对data.frame执行操作,其中我根据组汇总变量,然后希望将这些汇总值添加回数据。帧。 myDF <- data.frame(A = runif(5), B = c("A", "A", "A", "B", "B")) myDF$Total <- with(myDF, by(A, B, sum))[myDF$B] myDF$Proportion <- with(m

    1热度

    1回答

    这里是我想的名字的性别编码随着时间的推移一些样本数据: names_to_encode <- structure(list(names = structure(c(2L, 2L, 1L, 1L, 3L, 3L), .Label = c("jane", "john", "madison"), class = "factor"), year = c(1890, 1990, 1890, 1990, 18

    2热度

    3回答

    展开的大数据帧我有一个数据帧 df <- data.frame( id = c(1, 1, 1, 2, 2, 3, 3, 3, 3, 4), date = c("1985-06-19", "1985-06-19", "1985-06-19", "1985-08-01", "1985-08-01", "1990-06-19", "1990-06-19", "1990-

    3热度

    1回答

    我试图做使用dplyr如下因素: 假设你有data.framey和你想的基础上var1 y <- data.frame(var1 = rnorm(100)) y$var2 <- 0 y$var2[y$var1 > 0.5] <- 1 值来创建一个新的变量是否可以使用dplyr的mutate和filter来做到这一点?

    1热度

    1回答

    使用robCompositions包,我需要在组的基础上推算缺失值。例如,使用虹膜数据集。 library(robCompositions) library(dplyr) data(iris) # Insert random NAs for (i in 1:4) { n_NA = sample(0:10, 1) index_NA = sample(1:nrow(iri

    2热度

    1回答

    我可以使用循环来回答这个问题,我想不用(最好在dplyr或plyr中)。 我有一个数据帧和国家的名单 Data <- data.frame( Date = c(2012:2014,2014,2013:2014), Value = rnorm(6), ) Countries <- c("AUS","USA","UK") 数据帧看起来像这样 Date Value 1 2

    4热度

    1回答

    我不知道这是可能的,但如果它是,它将使生活是如此的效率高得多。 普遍的问题,这将是有趣的更广泛的SO社区:for循环(和碱功能类似于申请)适用于一般/一贯作业,如添加X到的数据帧的每列或行。我有一个普通/一致的操作我要执行,但对于数据帧中的每个元素的独特值。 有没有办法比子集化我的数据帧的每一个分组,应用相对具体的数字的函数来分组,然后重新组合更有效地做到这一点?我不在乎它是否为for循环或适用,

    0热度

    1回答

    我想通过以下对pwr.t.test: > twelve fail sampsize sd 1 0.047619 21 0.9759 2 0.000000 28 0.0000 3 0.000000 1 0.0000 4 0.000000 13 0.0000 5 0.000000 1 0.0000 6 0.000000 1 0.0000 7 0.000000

    17热度

    1回答

    我想使用dplyr将一个表按一列分组,然后将函数应用于每个组的第二列中的一组值。 例如,在下面的代码示例中,我想返回每个人所吃的食物的2项组合。我无法弄清楚如何在do()功能中正确提供功能和正确的色谱柱(食品)。 library(dplyr) person = c('Grace', 'Grace', 'Grace', 'Rob', 'Rob', 'Rob') foods = c('apple