tidyr

0热度

1回答

我有数据在一个列是列表的数据框中。这是一个例子： rand_lets <- function(){ sample(letters[1:26], runif(sample(1:10, 1), min=5, max=12)) } example_data <- data.frame(ID = seq(1:5), location = LETTERS[1:5],

-1热度

3回答

在R中，寻找更好的方法来获得最大值出小组（群内组）

对于包含组X，Y，Z的给定的DF，我希望保持包含最大值的行在每个如果在该行存在对应的PI值，则显示多个列（A_Column，C_Column，N_Column）。例如，对于X组，应从各列中为PI值C和A保留最大值。以下是我的尝试 - 是否有一个更短/更优雅的方式来实现相同的结果？我的出发DF： > DF Group H PI PC A_Column C_Column N_Colum

1热度

1回答

如何在将R从长格式转换为宽格式时创建新列名？

我想重塑一些数据从长格式到宽格式，但让我困惑的是如何根据原始长格式中的特定列重命名新列。 Name <- c("Brian","Brian","Brian") Age <- c(22,22,22) Date <- c("2017.1.3","2017.1.3","2017.1.4") School <- c("PH","En","Math") Score <- c(100,99,98)

1热度

1回答

完整的列与group_by和完成

我有一个小问题，使用dplyr group_by函数。这样做后： datasetALL %>% group_by(YEAR,Region) %>% summarise(count_number = n()) 这里是结果： YEAR Region count_number <int> <int> <int> 1 1946 1 2 2 1946 2 3 3 1946 3

0热度

2回答

重新组合，总结和组合变量

我一直在想我如何做到这一点，但到目前为止我找不到一个简单的解决方案。我有以下数据集： Itin Origin Destination Passengers 1 A B 1 1 B C 1 2 A B 3 3 E B 10 4 A C 2 5 E B 4 我试图做的是基于Itin变量，创建一个路径变量，同时保持乘客变量。理解这一点的

6热度

1回答

基于由冒号和连接向量定义的序列字符串创建长数据格式

我有数据，其中每个观察的ID都是以序列形式存储的数字，通常以X：Y的形式存在，但有时会连接列表。我想整理数据，以便每个观察都有自己的行，这样我就可以使用连接函数来添加更多描述性ID。通常我会使用tidyr中的gather()函数来完成此操作，但是我无法解开ID，因为它们是字符。的数据是这样的： example <- data_frame(x = LETTERS[1:3], y = c("Cond

0热度

2回答

中提取多个列，并保存在data.frame

我有以下列表： library(rjson) j <- fromJSON(file='https://esgf-data.dkrz.de/esg-search/search/?offset=0&limit=1000&type=Dataset&replica=false&latest=true&project=CORDEX&domain=EUR-11&experiment=rcp85&time_f

5热度

3回答

错误与tidyr :: gather（）当我有独特的名称

我有一个问题，从tidyr包收集（）函数。 sample # A tibble: 5 × 6 market_share Y2012 Y2013 Y2014 Y2015 Y2016 <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 KAB 0.23469425 0.23513725 0.23187590 0.22940831

1热度

1回答

tidyr UNNEST R错误在captureDots（）：该参数已经被评估

，收到以下错误，当我请从unnest文档的例子： Error in captureDots() : the argument has already been evaluated。我也在这里得到错误的例子：https://blog.rstudio.org/2016/02/02/tidyr-0-4-0/。 > version _ platform x86_64-ap

0热度

1回答

优雅的方式确定时间点之间的最后一次观察？

开始，这里的一些示例数据称为DF1： ID Time Score1 Score2 SumScore 1 Baseline 1 2 3 1 Midpoint 2 2 4 1 Final 3 2 5 2 Baseline 2 2 4 2 Midpoint 5 2 7 2 Final 6 2 8 我现在应该是一些在这些数据中我的“最后”的时间点得分的缺失不在