2017-05-04 80 views
6

我想做一些数据分析,想法是使用autobinning命令创建最佳bin,计算每个bin的WOE(证据权重)值,然后替换原始值属于具有相应WOE值的每个箱。所以下面是我做的:为NaN值创建一个bin

CreSC = creditscorecard(Data_Table ,'IDVar','CustID','GoodLabel',0); 
scAB = autobinning(CreSC,'Algorithm','Monotone'); 
DataTransformed = bindata(scAB,t_Data,'OutputType','WOE'); 

的问题是,上述程序不考虑NaN值是在数据,并自动排除它们。

我的目标是仅为NaN值创建单独的容器,并强制autobinning命令考虑NaN值。

有没有人有合理的解决方案?

回答

2

查找所有NaN值。

选取数据中不存在的值。

用这个值替换所有的NaN值。

运行你的分箱,最后你自己把这个值映射到NaN。

+0

谢谢你的回答。我已经尝试过了。这种方式似乎不起作用,因为分箱的间隔受到NaN上分配的值的影响。再次,我的目标是创建一个只有NaNs的垃圾箱! –