dplyr

    -2热度

    1回答

    我正在从STATA转换为R.我正努力复制的一件事是STATA的重塑功能。 在STATA大致这是可以做到用: reshape wide variable names, i(Unique person ID) j(ID identifying each entry per unique ID i) 我有一个包含由患者使用的静脉内线路的数据集(样品现在附)。该数据是目前龙(每1行)线。对于每一行你会

    3热度

    1回答

    我有一个大的JSON文件(8 GB,800万个案例),但我只需要它的一个小样本。简单的stream_in不起作用,因为文件太大。 为了解决这个问题,我想下面的代码: books <- list("Books_5.json") books <- map(books, ~ stream_in(file(.x)) %>% sample_n(385)) books <- as.data.frame(b

    0热度

    1回答

    我读过Programming with dplyr文档,并试图编写一个围绕case_when()函数的简单函数。 library(dplyr) data_test <- data.frame( a = rep(c("a", "b", "c"), each = 5), b = rnorm(15) ) fun_test <- function(df, var1, var2)

    0热度

    2回答

    我的数据集当然是更大的,但原理是一样的: library(tidyverse) df <- tibble(Name1 = c("Joe", "Harry", "Jane", NA, NA), Name2 = c("Joe", "Harry", "Thomas", "Bill", "Jane")) 问题1:我怎样才能提取值Name2("Thomas"和 "Bill")谁在Name1

    0热度

    1回答

    我想在dplyr的mutate中使用switch语句。我有一个简单的函数,执行某些操作,并且经由开关分配的替代值,例如: convert_am <- function(x) { x <- as.character(x) switch(x, "0" = FALSE, "1" = TRUE, NA) } 这个工作过程需要时施加到标量:

    1热度

    1回答

    考虑: x <- data.frame(Participant=c("1","1","1","1","1","1","1","1","1","1", "2","2","2","2","2","2","2","2","2","2", "3","3","3","3","3","3","3","3","3","3"), Day= c("1","2","3","4"

    1热度

    1回答

    我最近从R中的常见数据框操作转移到了tidyverse。但是我有一个关于使用scale()函数缩放列的问题。 我的数据由其中一些数字和一些分类特征的列组成。最后一列是数据的y值。所以我想缩放所有数字列,但不是最后一列。 使用select()函数,我可以编写很短的代码行,并选择需要缩放的所有数字列,如果我添加ends_with("...")参数。但我无法通过缩放来真正利用它。在那里,我必须使用tra

    1热度

    1回答

    我想从给定的csv文件“life.expectancy”中获取平均变化最高的区域的名称。我使用了“dplyr”包,但是,当我尝试在最后一步中检索区域的名称时,出现以下错误: lapply(.x,.f,...)中的错误:object'average .change'找不到。有没有一种方法可以得到与最大变化相对应的区域名称? 编辑:我用max(grouped.by.region $ average.c

    4热度

    4回答

    给出的列 如何取消选择自编函数的参数...中给出的列。 (我还需要选择在另一点列,所以只是在-指定...列不解决我的问题。) 任何soltions是apreciated,select -helpers,操纵quosures或表达式,... # very simple example data test <- data.frame(a=1:3, b=1:3, c=1:3) # function

    1热度

    2回答

    我正试图找到一种更好的方法,以基于列名部分的列组合来运行mutate()。 例如,一种方式,以简化在以下代码mutate功能: df <- data.frame(LIMITED_A = c(100,200), UNLIMITED_A = c(25000,50000), LIMITED_B = c(300,300), UNLIMITED_B = c(5