6
我想做一些数据分析,想法是使用autobinning
命令创建最佳bin,计算每个bin的WOE(证据权重)值,然后替换原始值属于具有相应WOE值的每个箱。所以下面是我做的:为NaN值创建一个bin
CreSC = creditscorecard(Data_Table ,'IDVar','CustID','GoodLabel',0);
scAB = autobinning(CreSC,'Algorithm','Monotone');
DataTransformed = bindata(scAB,t_Data,'OutputType','WOE');
的问题是,上述程序不考虑NaN
值是在数据,并自动排除它们。
我的目标是仅为NaN
值创建单独的容器,并强制autobinning
命令考虑NaN
值。
有没有人有合理的解决方案?
谢谢你的回答。我已经尝试过了。这种方式似乎不起作用,因为分箱的间隔受到NaN上分配的值的影响。再次,我的目标是创建一个只有NaNs的垃圾箱! –