我使用的数据看起来如下所示,它有50000个实例和32个变量.... 缺少的值存在于很多变量中,.. 抱歉,无法发布整个数据..如何解决R中的警告
我用
library(zoo)
d$V5 <- na.locf(d$V5)
和我进一步检查基尼价值,它给我的输出如下
Gini(d$V5)
[1] NA
Warning messages:
1: In sum(x * 1:n) : Integer overflow - use sum(as.numeric(.))
2: In n * sum(x) : NAs produced by integer overflow
但是d $ V5对应的年龄是一个数字 目标是找到基尼和信息增益并绘制决策树,由于缺少值决策树分裂是一个。因此,填写缺失值是必要的。 数据:
1 022 F O 044 0 N 31 12 00P 0012 Y Y N Y 0048 731 0.000000 Y N 0 VERA LUCIA N N 300.000000 0000 00 N 0
2 015 F S 018 0 Y 31 20 00 P 0216 Y Y Y Y 0012 853 0.000000 Y N 0 SARA FELIPE N N 300.000000 0000 00 N 0
3 024 F C 022 0 Y 31 08 00 P 0048 Y N Y Y 0012 040 0.000000 Y N 0 HELENA DOMINGOS SOGRA N N 229.000000 0000 00 N 0
4 012 F C 047 0 N 31 25 00 P 0180 Y Y N Y 0024 035 0.000000 Y N 0 JACI VALERIA ALEXANDRA TRAJANO N N 304.000000 0000 00 N 0
5 016 F S 028 0 Y 31 25 00 O 0012 Y Y Y Y 0012 024 0.000000 Y N 0 MARCIA CRISTINA ZANELLA SANDRO L P MARTINS N N 250.000000 0000 00 N 0
.....
49998 023 F S 023 0 Y 31 28 00 P 0264 Y Y Y Y 0012 991 0.000000 Y N 0 NOVINA GLAUCIA N N 240.000000 0000 00 N 1
49999 009 F C 038 0 Y 5 28 00 P 0048 Y Y Y Y 0204 040 0.000000 Y N 0 LILIANE FIGUEIREDO MIRNA CARVALHO NASCIMENTO N N 616.000000 0000 00 N 0
50000 022 M S 029 0 Y 31 23 00 P 0048 Y Y N Y 0036 026 0.000000 Y N 0 TITO MARTINS N N 341.000000 0000 00 N 0
这不是这个网站的工作原理。我们不做工作要求或要求。您需要付出一些努力来解决一个真正的问题:尝试一些具体的东西,向我们展示您的代码,给我们一个可重复的例子。 – joran
请参阅我试过的代码。对不起,我的工作,因此要求.. –
“[此代码]不起作用”没有帮助。你试过的代码的输出是什么,你期望它是什么? –