我的目标是制定有关诊断数据的重要规则。数据集限制尺寸
我预处理我的数据集中没有稀疏格式;我有116000个实例和28个属性。 我申请的Apriori算法WEKA所示(使用秧鸡资源管理器界面)
Apriori -N 20 -T 1 -C 0.8 -D 0.05 -U 1.0 -M 0.1 -M 0.1 -S -1.0 -c -1
算法似乎需要很长的时间才能完成。 目前超过三个小时即将结束。
是否正常?有一种方法可以加速算法(以其他方式预处理数据,或为Apriori选择其他参数)?或者weka不是这个维度的正确工具?
检查此问题http://stackoverflow.com/questions/15692012/input-arff-file-for-weka-apriori – grubjesic
不幸的是,Weka通常非常缓慢。尝试A)使用ELKI,SPMF或Christian Borgelt的C实现,而应该快得多,B)FPGrowth算法而不是Apriori。 –