tidyr

    11热度

    2回答

    我有面板结构的数据帧:2周的观察对每个单元由两年: library(tidyr) mydf <- data.frame( id = rep(1:3, rep(2,3)), year = rep(c(2012, 2013), 3), value = runif(6) ) mydf # id year value #1 1 2012 0.09668064 #2

    0热度

    1回答

    遵循整洁的数据标准,我使用键和值列以长格式输入数据。某些键的值为数字,其他键为字符,因此R将整列设置为字符类。 当我使用filter()仅将数字数据输入到ggplot(数据键'a'是数字),然后在值定义上使用as.numeric()时,它不能正确转换 - 我看到只是获取序列号值。我究竟做错了什么? filter(data, measure == "a") %>% ggplot(aes(x

    -1热度

    2回答

    我有一些困难的形式提取的ID: 27da12ce-85fe-3f28-92f9-e5235a5cf6ac 从数据帧: a<-c("NAME_27da12ce-85fe-3f28-92f9-e5235a5cf6ac_THOMAS_MYR", "NAME_94773a8c-b71d-3be6-b57e-db9d8740bb98_THIMO", "NAME_1ed571b4-

    1热度

    3回答

    我有一个带有结构化数据的丑陋列的data.frame。每列可容纳1到40个感兴趣的值。每个值都用html分隔符"<br />"分隔。提取的值作为1.1的形式,即一个整数周期和另一个整数。 如何将这些色谱柱分离并熔化成不同的行? 我知道lapply和tidy ::单独可能是要走的路。但我还没有成功。所以寻求帮助。 TESTDATA是在这里: testdata <- dget("http://past

    4热度

    1回答

    假设我有一个这样的数据帧: df<-data.frame(a=c("AA","BB"),b=c("short string","this is the longer string")) 我想拆分使用基于过去的空间发生的历史正则表达式的每个字符串。 我想: library(dplyr) library(tidyr) df%>% separate(b,c("partA","partB

    3热度

    3回答

    我有一个长格式的数据帧的狗,我试图重新格式化使用reshape()函数。它目前看起来像这样: dogid month year trainingtype home school timeincomp 12345 1 2014 1 1 1 340 12345 2 2014 1 1 1 360 31323 12 2015 2 7 3 440 31323 1

    2热度

    1回答

    矩阵这是我的数据帧的一瞥(): $ Row (int) 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 1, 1, 1, 1,... $ Col (int) 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4,... $ Value (dbl) 62049.67

    2热度

    4回答

    是否有函数将多个列值折叠为1个因子? 对于第2列4列,每条记录都只有1个TRUE值。 记录的结果值应该是具有真值的列名。 输入数据帧: data <- data.frame(user=c(1,2,3,4), blue=c(T,F,T,F), green=c(F,F,F,T), red=c(F,T,F,F)) user blue green red 1 1 TRUE FALSE FAL

    4热度

    3回答

    我有以下格式的数据帧: id | name | logs ---+--------------------+----------------------------------------- 84 | "zibaroo" | "C47931038" 12 | "fabien kelyarsky" | c("C47331040", "B19412225"

    44热度

    1回答

    借此样品变量 df <- data.frame(month=rep(1:3,2), student=rep(c("Amy", "Bob"), each=3), A=c(9, 7, 6, 8, 6, 9), B=c(6, 7, 8, 5, 6, 7)) 我可以使用spread从tidyr此更改为宽格式。 > df[, -4] %>% spread(