我的一位同事指出randomForest()
在超大型数据集中表现不佳。现在,我只是想弄清楚是不是真的是这样,但由于数据集不能共享(敏感信息),我想我不妨试着想出一个大型的数据集。我曾尝试以下,但不能使错误消息的意义:增加样本数据的大小 - R
library(randomForest)
data(iris)
dataFile <- iris
newdataFile <- dataFile[sample(dataFile, size= 1:1000000000, replace=T),]
错误消息:
Error in xj[i] : invalid subscript type 'list'
任何人都可以请指导我在这里?
我认为'虹膜[样品(尼罗(虹膜),1e5,替换= TRUE)]]将工作(即你并不需要'1:nrow(虹膜)') –
感谢您的点本! –