2017-07-08 67 views
1

在具有“ignore_const_cols”参数的h2o模型中,如何针对缺失值确定“常量”?ignore_const_cols缺失值

即,如果一列只有一个唯一的非缺失值和一些缺失值,并且选择了“ignore_const_cols”,那么在该列上将不会出现分裂以将缺失值与一个常量值分开?

回答

2

这是很容易测试这个

R代码里面:

library(h2o) 
h2o.init() 
iris_data<-as.data.frame(iris) 
iris_data$Petal.Width<-1 
iris_data[iris_data$Species=='setosa','Petal.Width']<-NA 
iris_h2o<-as.h2o(iris_data) 
h2o.gbm(training_frame=iris_h2o,y='Species') 
iris_data$Petal.Width<-as.factor(iris_data$Petal.Width) 
iris_h2o<-as.h2o(iris_data) 
h2o.gbm(training_frame=iris_h2o,y='Species') 

无论是否有缺失值常数列是数字或因素,给出了同样的警告:

Warning message: 
In .h2o.startModelJob(algo, params, h2oRestApiVersion) : 
    Dropping constant columns: [Petal.Width]. 

因此,您的问题的答案似乎是,当确定列是否为常数时,h2o忽略缺失值