dplyr

-2热度

1回答

我正在从STATA转换为R.我正努力复制的一件事是STATA的重塑功能。在STATA大致这是可以做到用： reshape wide variable names, i(Unique person ID) j(ID identifying each entry per unique ID i) 我有一个包含由患者使用的静脉内线路的数据集（样品现在附）。该数据是目前龙（每1行）线。对于每一行你会

3热度

1回答

大JSON文件的样本

我有一个大的JSON文件（8 GB，800万个案例），但我只需要它的一个小样本。简单的stream_in不起作用，因为文件太大。为了解决这个问题，我想下面的代码： books <- list("Books_5.json") books <- map(books, ~ stream_in(file(.x)) %>% sample_n(385)) books <- as.data.frame(b

0热度

1回答

在dplyr :: case_when中使用NSE

我读过Programming with dplyr文档，并试图编写一个围绕case_when()函数的简单函数。 library(dplyr) data_test <- data.frame( a = rep(c("a", "b", "c"), each = 5), b = rnorm(15) ) fun_test <- function(df, var1, var2)

0热度

2回答

是缺少在这两个变量中的一个返回值R

我的数据集当然是更大的，但原理是一样的： library(tidyverse) df <- tibble(Name1 = c("Joe", "Harry", "Jane", NA, NA), Name2 = c("Joe", "Harry", "Thomas", "Bill", "Jane")) 问题1：我怎样才能提取值Name2（"Thomas"和 "Bill"）谁在Name1

0热度

1回答

在dplyr的mutate中使用switch语句

我想在dplyr的mutate中使用switch语句。我有一个简单的函数，执行某些操作，并且经由开关分配的替代值，例如： convert_am <- function(x) { x <- as.character(x) switch(x, "0" = FALSE, "1" = TRUE, NA) } 这个工作过程需要时施加到标量：

1热度

1回答

长到宽重组通过ID和天

考虑： x <- data.frame(Participant=c("1","1","1","1","1","1","1","1","1","1", "2","2","2","2","2","2","2","2","2","2", "3","3","3","3","3","3","3","3","3","3"), Day= c("1","2","3","4"

1热度

1回答

R：使用dplyr缩放多个列的子集（具有相似的名称）

我最近从R中的常见数据框操作转移到了tidyverse。但是我有一个关于使用scale()函数缩放列的问题。我的数据由其中一些数字和一些分类特征的列组成。最后一列是数据的y值。所以我想缩放所有数字列，但不是最后一列。使用select()函数，我可以编写很短的代码行，并选择需要缩放的所有数字列，如果我添加ends_with("...")参数。但我无法通过缩放来真正利用它。在那里，我必须使用tra

1热度

1回答

获取分组行的名称

我想从给定的csv文件“life.expectancy”中获取平均变化最高的区域的名称。我使用了“dplyr”包，但是，当我尝试在最后一步中检索区域的名称时，出现以下错误： lapply（.x，.f，...）中的错误：object'average .change'找不到。有没有一种方法可以得到与最大变化相对应的区域名称？编辑：我用max（grouped.by.region $ average.c

4热度

4回答

dplyr：取消选择由

给出的列如何取消选择自编函数的参数...中给出的列。（我还需要选择在另一点列，所以只是在-指定...列不解决我的问题。）任何soltions是apreciated，select -helpers，操纵quosures或表达式，... # very simple example data test <- data.frame(a=1:3, b=1:3, c=1:3) # function

1热度

2回答

dplyr - 根据列名中的相似性改变公式

我正试图找到一种更好的方法，以基于列名部分的列组合来运行mutate()。例如，一种方式，以简化在以下代码mutate功能： df <- data.frame(LIMITED_A = c(100,200), UNLIMITED_A = c(25000,50000), LIMITED_B = c(300,300), UNLIMITED_B = c(5