tidyr

-1热度

1回答

我正在调查512个变量的数据。变量的数量很高，因为每个受访者对多个品牌都回答相同的问题。因此，每个变量（例如'偏好'）都有20列，对于受访者可能知道的每个品牌。我想要一个额外的专栏，这是一个品牌，但我没有管理这个。我申请tidyr包，这都非常好，第一组变量： TestSet100<-as.data.frame(TestSet100) TestSet100$ID <- factor(TestSe

4热度

1回答

在函数中传播多列

通常我需要spread多个值列，如this问题所示。但我经常这样做，我希望能够编写一个这样的函数。例如，给出的数据： set.seed(42) dat <- data_frame(id = rep(1:2,each = 2), grp = rep(letters[1:2],times = 2), avg = rnorm(4), sd = r

0热度

1回答

从原始卡片分类数据创建相似矩阵

我有一个来自在线卡片分类活动的数据集。参与者获得了随机子卡（来自更大的一组），并被要求创建他们感觉彼此相似的卡组。参与者可以根据自己的喜好创建任意数量的团体，并根据自己的意愿命名团体。示例数据集中是这样的： Data <- structure(list(Subject = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L,

0热度

2回答

R：总结一下，滴列在列表中更改数据框中的名称，并保存结果针对Env

这个话题的this one和this one相当搭配。我的烦恼来自我无法通过功能/代码tibbles列表中的所有元素。我知道如何一行一行地得到想要的结果，但不能在整体上做到。为主题，让我们采取两种tibbles在结构上与我的真实情况非常相似。 MyRes_tw <- structure(list(text = c("follow @SmartRE_Info and get your token

1热度

2回答

dplyr - 多个列的总和使用正则表达式

对于数据集mtcars2 mtcars2 = mtcars mtcars2 = mtcars2 %>% mutate(cyl9=cyl, disp9=disp, gear2=gear) 我希望得到一个新的列是多列的总和，通过使用正则表达式来捕捉模式。这是一个解决方案，但是这是通过硬编码 select(mtcars2, cyl9) + select(mtcars2, disp9) + sel

0热度

2回答

清洁的方式来重新排序巢purrr地图后tidyr传播

考虑以下几点： library(tidyverse) library(broom) tidy.quants <- mtcars %>% nest(-cyl) %>% mutate(quantiles = map(data, ~ quantile(.$mpg))) %>% unnest(map(quantiles, tidy)) tidy.quants #>

1热度

1回答

如何使用map（）将分组索引添加到数据框的列中？

我有两个测量数据在两个不同的组上，每个组有多个样本。我简单的版本有6个样品每一个看起来是这样的： library(tidyverse) df <- tibble(group = c(rep("group_A", 12), rep("group_B", 12)), sample = rep(1:6, 4), measurement = rep(c(rep("meas_A"

1热度

1回答

如何在R中将相关矩阵转换为df来创建行名，行索引，列索引，列名？

我有大约4000行和220列的数据集。由于研究和分析的原因，我创建了一个相关矩阵，并滤除了大于0.4的所有值，以便进一步研究这些特征。这里是我做过什么： df_high_corr <- which((res > 0.4 & res < 1), arr.ind = T) res1 <- as.data.frame(df_high_corr)) 我把它转换成数据帧，但我只有行标签的左边，我想

1热度

1回答

使用dplyr/tidyr方法提取字符串及其位置

输入数据框有三个id列和一个raw_text。 u_id对应于用户，doc_id对应于特定用户的文档，并且句子ID对应于用户文档内的句子。 df <- data.frame(u_id=c(1,1,1,1,1,2,2,2), doc_id=c(1,1,1,2,2,1,1,2), sent_id=c(1,2,3,1,2,1,2,1), text=c("a

1热度

2回答

如何在保持列名顺序的同时扩展tidyr :: spread（）？

如何在使用扩散函数时保持数字的等级时展开？ library(tidyverse) data.frame(time = paste0("t_", 1:100)) %>% rowwise() %>% mutate(rnd = sample(1:100, size=1)) %>% spread(time, rnd) 上面显示的代码的执行结果的列名是t_1, t_11