dplyr

    3热度

    1回答

    我对两个跨越四年的个体重复观察。我怎样才能随机选择一年中的所有观察结果? set.seed(123) dat <- data.frame(IndID = rep(c("AAA", "BBB"), each = 100), Year = sample(c("2001", "2002", "2003", "2005"),200, replace = T),

    2热度

    3回答

    我有一个数据框的几列,最后一个被称为Filename。这是它的样子。 Product Company Filename … … mg-tvd_bmmh_20170930.csv … … mg-tvd_bmmh_2016_06_13.csv … … … 我想写R中很短的脚本,从文件名取日期,并将其转换成一个新的列,我称之为一个Date。因此,一个新

    0热度

    1回答

    我需要在我的df中应用一个子集(深度1:深度nmN:nmN)函数,该函数应该同时使用两列(t & s)和行作为输入(深度,温度& sal)。我的真实数据有28列至128列170列。我想计算就像一个公式: x = z- [temp * (temp - tdev) + s * sal] 其中z它的观测值 df <- matrix(c( 1.0277, 1.0051, 1.0059, 1.003,

    0热度

    2回答

    在Excel中,我可以让该组的列和计数,但IAM无法做到在R. 对于R中做我使用剪切功能有一些休息。 cut(elapsed, breaks=seq(min(elapsed),max(elapsed)+100,50), include.lowest=T) 这里我附上了数据的png和所需的输出。 但上面的代码没有给我需要的输出。 这是我的数据 和我需要的输出: 400 9 500 4 6

    -1热度

    1回答

    我正在处理中等大小的数据集,并且我有兴趣一次重新编码多个变量。 有15个变量编码为三个等级的因子。 YES = 3,NO = 2,N/A = 1。 我想重新编码所有15个变量作为数字。 YES = 1,NO = 0,N/A = NA。 在更新我的软件之前,此代码工作。 my_data[, 9:23 := lapply(.SD, recode, "'YES'=1;'NO'=0;'N/A'=NA",

    0热度

    2回答

    我写了以下函数来计算两个位置之间的移动距离。 # Get Distance require(RJSONIO) address1 = "Noida Sector 62" address2 = "Connaught Place" url <- "https://maps.googleapis.com/maps/api/distancematrix/json?" url <- URLencod

    1热度

    1回答

    不显示我有这样的数据集: structure(list(CAMPAMENTO = c("Futura Esperanza", "Futura Esperanza", "Futura Esperanza", "Futura Esperanza", "Futura Esperanza", "Nuevo Amanecer", "Nuevo Amanecer", "Nuevo Amanecer", "

    0热度

    2回答

    有人可以解释为什么这个连接不起作用吗?我从here library(dplyr) library(stringr) library(tidytext) res<-"Hi my name"%>%strsplit("[[:space:]]")%>%inner_join(get_sentiments("afinn")) 我期望能获得这两个列表的交集适应代码。我做错了什么?需要注意的是get_

    5热度

    1回答

    在Python Pandas中,我想通过在多个列上执行多个聚合函数来添加列,如R dplyr mutate_each。 例如,Python Pandas是否可以实现与以下R脚本相同的处理? R dplyr : iris %>% group_by(Species) %>% mutate_each(funs(min, max, mean), starts_with("Sepal

    1热度

    3回答

    我有以下data.frame Category Product Status 1 A qwe In 2 A rty In 3 A ewq Out 4 B dfs In 5 B sgf In 6 C mnb Out 7 C ves Out 8 C klm Out 9 C nbc Out 我的目标是从类别在水平OnlyIn创建列标志每组