tidyr

    0热度

    1回答

    我有数据在一个列是列表的数据框中。这是一个例子: rand_lets <- function(){ sample(letters[1:26], runif(sample(1:10, 1), min=5, max=12)) } example_data <- data.frame(ID = seq(1:5), location = LETTERS[1:5],

    -1热度

    3回答

    对于包含组X,Y,Z的给定的DF,我希望保持包含最大值的行在每个如果在该行存在对应的PI值,则显示多个列(A_Column,C_Column,N_Column)。例如,对于X组,应从各列中为PI值C和A保留最大值。以下是我的尝试 - 是否有一个更短/更优雅的方式来实现相同的结果? 我的出发DF: > DF Group H PI PC A_Column C_Column N_Colum

    1热度

    1回答

    我想重塑一些数据从长格式到宽格式,但让我困惑的是如何根据原始长格式中的特定列重命名新列。 Name <- c("Brian","Brian","Brian") Age <- c(22,22,22) Date <- c("2017.1.3","2017.1.3","2017.1.4") School <- c("PH","En","Math") Score <- c(100,99,98)

    1热度

    1回答

    我有一个小问题,使用dplyr group_by函数。 这样做后: datasetALL %>% group_by(YEAR,Region) %>% summarise(count_number = n()) 这里是结果: YEAR Region count_number <int> <int> <int> 1 1946 1 2 2 1946 2 3 3 1946 3

    0热度

    2回答

    我一直在想我如何做到这一点,但到目前为止我找不到一个简单的解决方案。 我有以下数据集: Itin Origin Destination Passengers 1 A B 1 1 B C 1 2 A B 3 3 E B 10 4 A C 2 5 E B 4 我试图做的是基于Itin变量,创建一个路径变量,同时保持乘客变量。 理解这一点的

    6热度

    1回答

    我有数据,其中每个观察的ID都是以序列形式存储的数字,通常以X:Y的形式存在,但有时会连接列表。我想整理数据,以便每个观察都有自己的行,这样我就可以使用连接函数来添加更多描述性ID。通常我会使用tidyr中的gather()函数来完成此操作,但是我无法解开ID,因为它们是字符。 的数据是这样的: example <- data_frame(x = LETTERS[1:3], y = c("Cond

    0热度

    2回答

    我有以下列表: library(rjson) j <- fromJSON(file='https://esgf-data.dkrz.de/esg-search/search/?offset=0&limit=1000&type=Dataset&replica=false&latest=true&project=CORDEX&domain=EUR-11&experiment=rcp85&time_f

    5热度

    3回答

    我有一个问题,从tidyr包收集()函数。 sample # A tibble: 5 × 6 market_share Y2012 Y2013 Y2014 Y2015 Y2016 <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 KAB 0.23469425 0.23513725 0.23187590 0.22940831

    1热度

    1回答

    ,收到以下错误,当我请从unnest文档的例子: Error in captureDots() : the argument has already been evaluated。 我也在这里得到错误的例子:https://blog.rstudio.org/2016/02/02/tidyr-0-4-0/。 > version _ platform x86_64-ap

    0热度

    1回答

    开始,这里的一些示例数据称为DF1: ID Time Score1 Score2 SumScore 1 Baseline 1 2 3 1 Midpoint 2 2 4 1 Final 3 2 5 2 Baseline 2 2 4 2 Midpoint 5 2 7 2 Final 6 2 8 我现在应该是一些在这些数据中我的“最后”的时间点得分的缺失不在