subset

0热度

1回答

我有大约100万套每套大约30个元素。对于每一组，我想生成所有大小为“k”的子集，其中k将是3或4或5.我是新来的番石榴，并决定尝试它。我找到了powerSet方法（https://google.github.io/guava/releases/21.0/api/docs/com/google/common/collect/Sets.html），它将为我的每个集合生成所有子集。我可以循环遍历每个

1热度

1回答

如何在没有循环的情况下向data.frame添加多个值？

假设我有矩阵D，它由每年特定年龄的死亡人数组成。我想填充此矩阵与适当的死亡计数存储在向量年龄，但下面的代码给了我错误的答案。我应该如何编写代码而不进行循环？ # Year and age grid for tables Years=c(2007:2017) Ages=c(60:70) #Data.frame of deaths D=data.frame(matrix(ncol=len

0热度

3回答

拆分基于条件

我的数据我有一个数据要被splited为两个集合，如我在一组需要低于146个数据点和上述146在另一组。原始数据集是 dat <- c(208.3, 357.63, 238.06, 227.91, 231.79, 275.43, 241.27, 163.39, 160.31, 255.23, 214.74, 209.92, 160.32, 222.22, 133.8, 240.94,

-1热度

1回答

如何在数据子集上运行t检验

首先，该数据集是否为t检验的整齐形式？ https://i.stack.imgur.com/tMK6R.png 其次，我试图做一个两个样本t检验在治疗A和B的时间为3“结果1”的手段比较。我会如何去做这件事？的样本数据： df <- structure(list(code = c(100, 100, 100, 101, 101, 101, 102, 102, 102, 103, 10

-1热度

1回答

R：如何子集的data.frame

set.seed(3) mydata <- data.frame(id = c(1:5), score = c(rnorm(5, 0, 1))) ids <- c(1, 2, 3, 3) > subset(mydata, id %in% ids) id score 1 1 -0.9619334 2 2 -0.2925257 3 3 0.2587882 我有

0热度

1回答

多布尔列

我与日期的列中，值的列和半打布尔列的数据帧ggplot方面： date value x1 x0 x2 x3 .... 01/1999 2000 TRUE FALSE TRUE FALSE 02/1999 5000 FALSE TRUE FALSE FALSE 02/1999 6000 FALSE TRUE FALSE TRUE 03/1999 5000 TRU

1热度

2回答

在R中设置输出以生成摘要

以下是一个数据框（DF），其中包含一系列我进行的市场营销活动。成功百分比显示受访者人数，沟通类型指频道facebook，twitter等（Ai- FB，L1-Linkedin）。笔记本电脑，新的和鼠标是指组成该句子的单词。原始数据帧有一句话说 - 买一台新的笔记本电脑，并获得免费的鼠标。我已经用qdap解析了上面的内容，并在下面生成了DF。 Sl NO Success_Percentage com

0热度

2回答

根据层次结构查找独特的分类计数

0热度

1回答

具有相同的价值分组数据表出现两次以上

我创建了一个数据表df library(data.table) df <- data.table(id = c(1,1,1,2,2,3), starts = c(0,0,6,0,9,0), ends = c(0,6,10,9,20,7)) #id starts ends #1: 1 0 0 #2: 1 0 6 #3: 1 6 10 #4: 2 0 9 #5: 2

0热度

1回答

数据清理和表中的拼写错误

我有这个CSV数据集，我需要创建一个函数来执行数据清理，但仍然无法正常工作，而且我的想法已经过时。以下是Google云端硬盘上的dataset。这是我需要做的：纠正可能的输入删除不相关的数据（仅在奥克兰和惠灵顿的房屋被认为是）删除离群值，例如负值区，负功耗，非常高的地区，非常高的功率消耗到目前为止，这是我做的代码： # Reading data set installed.packa