2015-06-28 161 views
2

我有一个拥有100k个数据字段的大型数据集。当我尝试STR()或查看没有glitched发生的全部数据,但是当我运行在训练软件rpart设置需要花费一段时间后约3-4分钟就会出现在下面的错误,为大数据集调用rpart时发生错误

Error: Unable to establish connection with R session

我的脚本如下所示:

# Decision tree 
library(rpart)      
library(rattle)         
library(party) 

train_set <- read.table('my_sample_trainset.csv', header=TRUE, sep=',', stringsAsFactors=FALSE) 
test_set <- read.table('my_sample_testset.csv', header=TRUE, sep=',', stringsAsFactors=FALSE) 

my_trained_tree <- rpart(Route ~ Bus_Id + week_days + time_slot, data=train_set, method="class") 
# Error occurs on/after this line 

my_prediction <- predict(my_trained_tree, test_set, type = "class") 

my_solution <- data.frame(Route = my_prediction) 

write.csv(my_solution, file = "solution.csv", row.names = FALSE) 

我是否缺少图书馆?或会出现这种情况,因为大数据集(6.5MB)

此外,我使用rStudio版本0.99.447在Mac OS X约塞米蒂

回答

1

该消息意味着,R为仍在计算的结果。如果打开活动监视器并按CPU选项卡上的CPU使用率排序,则应该看到rsession正在使用100%的CPU。因此,您可以在该消息上单击“确定”,并允许R保持计算。

我希望有一个解决方法,虽然这个问题困扰着我,我们说话!

+0

“我希望......”是否意味着没有解决方法? – Dinal24