missing-data

    4热度

    3回答

    我有两个numpy数组NS,EW来加总。他们每个人都有不同位置的缺失值,像 NS = array([[ 1., 2., nan], [ 4., 5., nan], [ 6., nan, nan]]) EW = array([[ 1., 2., nan], [ 4., nan, nan], [ 6., nan, 9.]] 我如何能在numpy的方

    0热度

    1回答

    我有一个df看起来像这样,我需要运行一个代码来产生change。 change被定义为第一次永久性正面outcome(outcome = 1)。 的逻辑如下: 每个ID具有5 visits在每个visit 的change变量的outcome的值只能是1如果结果是1在visit x和其后 例如,id 2不能有change = 1在time 2因为outcome回复为负在time 3. 一个额外的皱纹

    0热度

    3回答

    我对以下问题有疑问。我有一个看起来像这样的数据: State Total AZ 1000 AZ 1000 AZ - CA - CA 4000 也就是说,我已经失踪了变量“总”的一些看法数据。我想用非遗漏的观测数据替换缺失的数值。 所需的输出 enter code here State Total AZ 1000 AZ 1000 AZ **1000** CA **4000**

    2热度

    1回答

    我想为不缺少多个值的个案计算多个新变量。对于Var.1至Var.10缺失的情况,我希望计算的变量A, B, C为SYSMIS。 示例代码: DO IF (NOT MISSING(Var.1 to Var.10)). COMPUTE A=0. COMPUTE B=0. COMPUTE C=0. END IF. 这产生多个错误: DO IF - 的参数的函数的数是不正确的。 END IF

    0热度

    1回答

    我使用SPSS modeler并且我有一个变量,该软件将其识别为数字。所以missing的值是$null$。我希望变量的缺失值可以用''作为character来选择。 因此,我想:或者从numeric trasform变量的格式character或只改变missing值从$null$到''。 我该如何解决? 在此先感谢

    -1热度

    1回答

    我有这个(大)数据框,我想添加缺少的行(填充0)与名为“date”的列有关。 例如: date 0 1 2 3 4 5 199807 0 546.98 19355.55 1110.6 4720.34 3435.9 199808 0 1668.85 4398.29 5816.71 599.7 535.28 199809 608.79 446.68 2297.68 1

    2热度

    4回答

    因此,我有调查数据,我想解决调查的多个管理问题(计算机失败,浏览器关闭以及人员重新启动)。说我有案件X1和X2,由同一人的顺序进行(在这里,已经退出了作为载体) x1 <- c(1:35, rep(NA, 65)) x2 <- c(-1:-95, rep(NA, 5)) 既然我能知道发生X1首先,我要确定X1第一NA过去所有更多的条目都是NA(位置36),所以我可以合并这些案例来生成仅代表第

    0热度

    3回答

    我需要对我的数据执行z归一化(即转换变量为mean = 0和sd = 1)。 我用下面的公式(例如缩放年平均温度,“MAT”): sca$MAT <- (sca$MAT - mean(sca$MAT))/sd(sca$MAT) ,但我得到NaN值,因为很少有数据缺失这个变量。如何在上述公式中排除MAT的NA值? PS:我试图在公式中包含na.rm=TRUE,但它不起作用。 一个更快的方式很可能

    1热度

    2回答

    有条件填充丢失的数据我有一个数据帧,使得: df$v1 = c('2', '', '', '', '3', '', '4', '', '', 'OT') 我想这个可变格式化为一个序变量。然而, df$v1 = as.ordered(df$v1) 结果: Ord.factor w/ 5 levels ""<"2"<"3"<"4"<..: 2 1 1 1 3 1 4 1 1 5 [R读取空

    0热度

    2回答

    我有一个数据帧,看起来像这样: d <- data.frame(county = c("Abilene", rep(NA, 5), "Cook", rep(NA, 4), "Blah", NA, "Allegheny", rep(NA, 3))) county 1 Abilene 2 <NA> 3 <NA> 4 <NA> 5 <NA> 6 <NA> 7 Co