missing-data

    2热度

    1回答

    我有两个数据集: a。看起来像这样的数据帧: SpeciesA SpeciesB SpeciesC SpeciesD SpeciesE SpeciesY SpeciesZ Site1 1 0 4 6 2 5 2 Site2 1 0 4 6 2 5 3 Site3 1 0 4 6 2 5 4 Site4 1 0 4 6 2

    2热度

    3回答

    我需要在组内的数据框的列中转发填充值。我应该注意到,一个群体的第一个价值永远不会被建筑遗失。目前我有以下解决方案。 df = pd.DataFrame({'a': [1,1,2,2,2], 'b': [1, np.nan, 2, np.nan, np.nan]}) # desired output a b 1 1 1 1 2 2 2 2 2 2 以下是我迄今尝试的三种解决方案。

    1热度

    1回答

    我正在试验来自imputeTS包的函数。该软件包提供了几种函数来计算单变量时间序列数据中的缺失值。我测试了它们,它们都很棒,除了na.kalman功能。该功能改变原始数字矢量。下面是一个例子。 # Load packages library(imputeTS) # Set seeds set.seed(123) # Generate 10 random number dat <- r

    0热度

    1回答

    美好的一天,亲爱的同事 你能帮助我吗?我找不到决定。我从MySQL获得数组,看起来像(数量和月): [2, 07.16, 3, 08.16, 2, 10.16, 1, 11.16, 1, 12.16, 1, 01.17] ,我需要补充一点,在这个周期内错过了0个月。对于此阵应增加08.16后0和09.16,因此成为的样子: [2, 07.16, 3, 08.16, 0, 09.16, 2, 10.

    0热度

    2回答

    我有以下data.frame,“子集” Time A B C 2016-10-07 06:16:46 NA NA 41 2016-10-07 06:26:27 40 39 42 2016-10-07 06:38:23 NA 40 NA 2016-10-07 06:41:06 42 42 44 2016-10-07 06:41:06 NA 42 44 2016-10-07 06:41

    1热度

    1回答

    对不起,这可能有一个明显的答案,但我有点不确定该怎么做。 例如说我有一个数据集,我有名字的人列表,销售他们制作的数量,他们让这些销售的日期,所有的格式如下: Name | Date | Sales ------------------------------------ AAA | 01/01/2001 | 50 AAA | 01/02/2001 | 62 AAA | 01/0

    1热度

    1回答

    我有一个数据集,有100列和50万行。对于列Z,某些值缺失。我将首先将数据按2列(A,B)分组,然后对于每个组,我得到中位数(跳过这些nans),然后我想用相应组的中位数填充Z中的nans。 我可以 df.groupby(["A","B"]).Z.median() 但它也有NaN的一些集团和我不知道如何着手,真正填补这些NaN的在Z由组中位数...

    0热度

    2回答

    我有一个包含缺失值的数据框。这些缺失的值跨越多个变量,但是在所述变量中出现,一次出现在特定观察值上。例如,我的数据帧看起来像: r1 = c('', 'abc def', '') r2 = c('1', 'ghi jkl', '2') r3 = c('', 'mno pqr', '') df = as.data.frame(rbind(r1, r2, r3)) 我想在所有情况下,“X”,

    1热度

    1回答

    我正在进行一项学校项目,在该项目中,我需要对缺失数据进行补偿,并在用鼠标进行插补后尝试使用完整功能生成完整的数据集。 当我一个接一个地运行它们时,一切正常,但我想用for循环来防止我想要的不止m = 5插值。现在,当试图运行for-loop时,我总是得到错误 完整错误(插补[1]):输入数据必须具有类'mids'。 但是当我查看这个类时是 mids,这里怎么回事? 这是我的代码: imputati

    1热度

    1回答

    我想所有的细胞转化与非数值数据缺失(NA)。我尝试了类似的方式将特定值转换为丢失数据,如: recode_missing <- function (g, misval) { a <- g == misval temp = g temp [a] <- NA return (temp) } 这很好用:一个优雅的R解决方案。 我试图解码像a <- g ==