tidyr

    -1热度

    1回答

    我正在调查512个变量的数据。变量的数量很高,因为每个受访者对多个品牌都回答相同的问题。因此,每个变量(例如'偏好')都有20列,对于受访者可能知道的每个品牌。我想要一个额外的专栏,这是一个品牌,但我没有管理这个。 我申请tidyr包,这都非常好,第一组变量: TestSet100<-as.data.frame(TestSet100) TestSet100$ID <- factor(TestSe

    4热度

    1回答

    通常我需要spread多个值列,如this问题所示。但我经常这样做,我希望能够编写一个这样的函数。 例如,给出的数据: set.seed(42) dat <- data_frame(id = rep(1:2,each = 2), grp = rep(letters[1:2],times = 2), avg = rnorm(4), sd = r

    0热度

    1回答

    我有一个来自在线卡片分类活动的数据集。参与者获得了随机子卡(来自更大的一组),并被要求创建他们感觉彼此相似的卡组。参与者可以根据自己的喜好创建任意数量的团体,并根据自己的意愿命名团体。 示例数据集中是这样的: Data <- structure(list(Subject = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L,

    0热度

    2回答

    这个话题的this one和this one相当搭配。 我的烦恼来自我无法通过功能/代码tibbles列表中的所有元素。我知道如何一行一行地得到想要的结果,但不能在整体上做到。 为主题,让我们采取两种tibbles在结构上与我的真实情况非常相似。 MyRes_tw <- structure(list(text = c("follow @SmartRE_Info and get your token

    1热度

    2回答

    对于数据集mtcars2 mtcars2 = mtcars mtcars2 = mtcars2 %>% mutate(cyl9=cyl, disp9=disp, gear2=gear) 我希望得到一个新的列是多列的总和,通过使用正则表达式来捕捉模式。 这是一个解决方案,但是这是通过硬编码 select(mtcars2, cyl9) + select(mtcars2, disp9) + sel

    0热度

    2回答

    考虑以下几点: library(tidyverse) library(broom) tidy.quants <- mtcars %>% nest(-cyl) %>% mutate(quantiles = map(data, ~ quantile(.$mpg))) %>% unnest(map(quantiles, tidy)) tidy.quants #>

    1热度

    1回答

    我有两个测量数据在两个不同的组上,每个组有多个样本。我简单的版本有6个样品每一个看起来是这样的: library(tidyverse) df <- tibble(group = c(rep("group_A", 12), rep("group_B", 12)), sample = rep(1:6, 4), measurement = rep(c(rep("meas_A"

    1热度

    1回答

    我有大约4000行和220列的数据集。 由于研究和分析的原因,我创建了一个相关矩阵,并滤除了大于0.4的所有值,以便进一步研究这些特征。 这里是我做过什么: df_high_corr <- which((res > 0.4 & res < 1), arr.ind = T) res1 <- as.data.frame(df_high_corr)) 我把它转换成数据帧,但我只有行标签的左边,我想

    1热度

    1回答

    输入数据框有三个id列和一个raw_text。 u_id对应于用户,doc_id对应于特定用户的文档,并且句子ID对应于用户文档内的句子。 df <- data.frame(u_id=c(1,1,1,1,1,2,2,2), doc_id=c(1,1,1,2,2,1,1,2), sent_id=c(1,2,3,1,2,1,2,1), text=c("a

    1热度

    2回答

    如何在使用扩散函数时保持数字的等级时展开? library(tidyverse) data.frame(time = paste0("t_", 1:100)) %>% rowwise() %>% mutate(rnd = sample(1:100, size=1)) %>% spread(time, rnd) 上面显示的代码的执行结果的列名是t_1, t_11