subset

    0热度

    1回答

    我有大约100万套每套大约30个元素。对于每一组,我想生成所有大小为“k”的子集,其中k将是3或4或5.我是新来的番石榴,并决定尝试它。我找到了powerSet方法(https://google.github.io/guava/releases/21.0/api/docs/com/google/common/collect/Sets.html),它将为我的每个集合生成所有子集。 我可以循环遍历每个

    1热度

    1回答

    假设我有矩阵D,它由每年特定年龄的死亡人数组成。 我想填充此矩阵与适当的死亡计数存储在 向量年龄,但下面的代码给了我错误的答案。我应该如何编写代码而不进行循环? # Year and age grid for tables Years=c(2007:2017) Ages=c(60:70) #Data.frame of deaths D=data.frame(matrix(ncol=len

    0热度

    3回答

    我的数据我有一个数据要被splited为两个集合,如我在一组需要低于146个数据点和上述146在另一组。原始数据集是 dat <- c(208.3, 357.63, 238.06, 227.91, 231.79, 275.43, 241.27, 163.39, 160.31, 255.23, 214.74, 209.92, 160.32, 222.22, 133.8, 240.94,

    -1热度

    1回答

    首先,该数据集是否为t检验的整齐形式? https://i.stack.imgur.com/tMK6R.png 其次,我试图做一个两个样本t检验在治疗A和B的时间为3“结果1”的手段比较。我会如何去做这件事? 的样本数据: df <- structure(list(code = c(100, 100, 100, 101, 101, 101, 102, 102, 102, 103, 10

    -1热度

    1回答

    set.seed(3) mydata <- data.frame(id = c(1:5), score = c(rnorm(5, 0, 1))) ids <- c(1, 2, 3, 3) > subset(mydata, id %in% ids) id score 1 1 -0.9619334 2 2 -0.2925257 3 3 0.2587882 我有

    0热度

    1回答

    我与日期的列中,值的列和半打布尔列的数据帧ggplot方面: date value x1 x0 x2 x3 .... 01/1999 2000 TRUE FALSE TRUE FALSE 02/1999 5000 FALSE TRUE FALSE FALSE 02/1999 6000 FALSE TRUE FALSE TRUE 03/1999 5000 TRU

    1热度

    2回答

    以下是一个数据框(DF),其中包含一系列我进行的市场营销活动。成功百分比显示受访者人数,沟通类型指频道facebook,twitter等(Ai- FB,L1-Linkedin)。笔记本电脑,新的和鼠标是指组成该句子的单词。原始数据帧有一句话说 - 买一台新的笔记本电脑,并获得免费的鼠标。我已经用qdap解析了上面的内容,并在下面生成了DF。 Sl NO Success_Percentage com

    0热度

    2回答

    我已经搜索了这样做的方法,但是使用count(unique())不搜索其他因素。以下是一个示例数据集。 +------+------+--------------+----------------+-----------+-------+ | Site | Date | TaxonID | Family | Genus | Count | +------+------+----------

    0热度

    1回答

    我创建了一个数据表df library(data.table) df <- data.table(id = c(1,1,1,2,2,3), starts = c(0,0,6,0,9,0), ends = c(0,6,10,9,20,7)) #id starts ends #1: 1 0 0 #2: 1 0 6 #3: 1 6 10 #4: 2 0 9 #5: 2

    0热度

    1回答

    我有这个CSV数据集,我需要创建一个函数来执行数据清理,但仍然无法正常工作,而且我的想法已经过时。 以下是Google云端硬盘上的dataset。 这是我需要做的: 纠正可能的输入 删除不相关的数据(仅在奥克兰和惠灵顿的房屋被认为是) 删除离群值,例如负值区,负功耗,非常高的地区,非常高的功率消耗 到目前为止,这是我做的代码: # Reading data set installed.packa