过多的水平/类别h2o.importFile加载数据时出错（）

我试图导入使用h2o.importfile大.csv文件中的R过多的水平/类别h2o.importFile加载数据时出错（）

library(h2o) 
h2o.init() 
dataFile <- "big_file.csv" 
h2o.importFile(dataFile,header=TRUE,destination_frame = "data.hex")

的文件里有一些ID列。我收到以下错误消息。

错误：water.parser.ParseDataset $ H2OParseException：超出列[id1，id2]的分类限制。考虑将这些列重新解析为一个字符串。

是指定这些科拉姆类型为字符串类似data.frame（stringAsFactors = FALSE）

来源

2017-02-27 iboboboru

指定col.types论点h2o.importFile功能应该为你在那里工作的方式。

write.csv(iris, "iris.csv") 
hf0 <- h2o.importFile("iris.csv", col.types = c("int","real","real","real","real","string")) 
unlist(h2o.getTypes(hf0)) 
[1] "int" "real" "real" "real" "real" "string"

来源

2017-02-27 17:26:19 jmuhlenkamp

过多的水平/类别h2o.importFile加载数据时出错（）

回答

相关问题