2017-02-27 22 views
0

我试图导入使用h2o.importfile大.csv文件中的R过多的水平/类别h2o.importFile加载数据时出错()

library(h2o) 
h2o.init() 
dataFile <- "big_file.csv" 
h2o.importFile(dataFile,header=TRUE,destination_frame = "data.hex") 

的文件里有一些ID列。我收到以下错误消息。

错误:water.parser.ParseDataset $ H2OParseException:超出列[id1,id2]的分类限制。考虑将这些列重新解析为一个字符串。

是指定这些科拉姆类型为字符串类似data.frame(stringAsFactors = FALSE)

回答

1

指定col.types论点h2o.importFile功能应该为你在那里工作的方式。

write.csv(iris, "iris.csv") 
hf0 <- h2o.importFile("iris.csv", col.types = c("int","real","real","real","real","string")) 
unlist(h2o.getTypes(hf0)) 
[1] "int" "real" "real" "real" "real" "string"