2015-11-20 57 views
0

我正在处理一个包含614个变量和1348个事务的数据集,并试图在R中运行它,但是,处理时间过长,代码从未显示最终输出,而且我的笔记本电脑是挂。apriori算法需要时间r

a <- read.csv("v.csv") 
library(arules) 
for(i in 1:ncol(a)) 
    a[i]<- as.factor(a[,i]) 
rules <- apriori(a,parameter=list(supp = .5 , conf = 0.9, target="rules")) 
summary(g) 

请告诉我哪里出错了。

+1

首先尝试一个小子集,然后再构建它。我怀疑你不会做很多事情,因为你似乎每个参数有2个数据点。 –

回答

1

我认为你的问题可能与数据有关。我认为a中的一些变量可能是连续变量,as.factor将为每个唯一值创建一个因子值。 apriori然后会尝试将每个因素值转换成单个项目,创建一个非常大的矩阵,导致您的笔记本电脑挂起。

注:这是纯粹的猜测,因为我不知道你的数据是怎么样的。