2
我有一个拥有100k个数据字段的大型数据集。当我尝试STR()或查看没有glitched发生的全部数据,但是当我运行在训练软件rpart设置需要花费一段时间后约3-4分钟就会出现在下面的错误,为大数据集调用rpart时发生错误
Error: Unable to establish connection with R session
我的脚本如下所示:
# Decision tree
library(rpart)
library(rattle)
library(party)
train_set <- read.table('my_sample_trainset.csv', header=TRUE, sep=',', stringsAsFactors=FALSE)
test_set <- read.table('my_sample_testset.csv', header=TRUE, sep=',', stringsAsFactors=FALSE)
my_trained_tree <- rpart(Route ~ Bus_Id + week_days + time_slot, data=train_set, method="class")
# Error occurs on/after this line
my_prediction <- predict(my_trained_tree, test_set, type = "class")
my_solution <- data.frame(Route = my_prediction)
write.csv(my_solution, file = "solution.csv", row.names = FALSE)
我是否缺少图书馆?或会出现这种情况,因为大数据集(6.5MB)
此外,我使用rStudio版本0.99.447在Mac OS X约塞米蒂
“我希望......”是否意味着没有解决方法? – Dinal24