tidyr

    1热度

    1回答

    几十个地块的要复杂得多,但由于某种原因,我的大脑是不工作这一个我有.. 给出一个数据帧和代码... # libraries require(ggplot2) require(dplyr) require(tidyr) # create data data <- data.frame("When"=c("(2008 - 2009)","(2010 - 2011)","(2012 - 20

    2热度

    2回答

    我对一些tidyr行为感到困惑。我可以UNNEST这样的单一响应: library(tidyr) resp1 <- c("A", "B; A", "B", NA, "B") resp2 <- c("C; D; F", NA, "C; F", "D", "E") resp3 <- c(NA, NA, "G; H; I", "H; I", "I") data <- data.frame(re

    3热度

    3回答

    我相信我的问题与最佳实践一样多,因为它涉及整理凌乱的数据,所以在这里。 下面是数据框lang.df的摘录,这是一个学校范围内的学生数据集。该列Langauge.Home表示家长对该问题的回复: “你在家里说什么语言?” > lang.df Nationality Language.Home 1 HK Mandarin 2 German Mandarin/Engli

    -1热度

    1回答

    我在将数据分成两列或三列时遇到了一些问题。 以下是字符串,我想处理下一列 station "Park Rd & Holmead Pl NW (31602)" 我能做些什么把它分成两列:, 怎么可能 station address "Park Rd & Holmead Pl NW " station number 31602 以类似的方式我分开以下字符串? station "Park

    0热度

    1回答

    我使用R和我有一样 California | Los Angeles California | San Diego California | San Francisco New York | Albany New York | New York City 数据,我想转换到 California | New York Los Angeles | Albany San Diego |

    -1热度

    1回答

    此问题是另一篇文章的标题为 - 将“名称”分隔为数据框的“名”和“姓”列的扩展 - 数据框在下面提供。 NAME <- c('John Doe','Peter Gynn','Jolie Hope-Douglas', 'Muhammad Arnab Halwai') TITLE <- c("assistant", "manager", "assistant", "specialist") tte

    -3热度

    1回答

    在本示例数据中,三个人将10个项目分为可变数量的组并为每个组提供文本标签。 人员和标签是文本字段。下载并读入R时的项目var作为整数读取。项目变量实际上是分类数据并为项目定义文本;一个测试的项目编号是一个很好的比喻。标签,物品和人员可以按任何顺序排列,我通常按照您在此处看到的方式对数据进行排序,以便进行目视检查。每个人在这个例子中有10个项目,在现实世界中通常有100个项目。每个人都有可变数量的标

    0热度

    2回答

    我有数千这种类型的线组成的文件: 1 number entry size1 size2 value size5 value2 my_id1k "AJKJjsdfe76r55"; my_label “1900”; my_idk2 "49354ytu866"; you_digit "some"; my_copy “jkl”; 1 number entry size3 size4 value size

    4热度

    2回答

    我在R中有一个data.frame,为了简单起见,它有一列,我想分开。它看起来像这样: V1 Value_is_the_best_one This_is_the_prettiest_thing_I've_ever_seen Here_is_the_next_example_of_what_I_want 我真正数据量非常大(数百万行的),所以我想用tidyr的单独的函数(因为它是惊人的快)

    2热度

    1回答

    我可以使用括号作为分隔符不单独的列: d = data.frame(a = c('af(dsf', 'sdf (asdf', 'sdf(df')) d %>% separate(a, c('a','b'), sep = '(') 错误stringi :: stri_split_regex(值,九月,N_MAX):错误地 嵌套在正则表达式模式括号。 (U_REGEX_MISMATCHED_PA