2016-10-21 149 views
0

我目前正在处理具有20个特征和400K行的数据集。我正在使用e1071库进行使用SVM的多类分类。我有这个代码,需要大约2天的时间才能找到结果。有没有一种方法可以减少使用同一个库的时间复杂度?如果不是我最好在R中考虑哪些其他库或选项?如何减少SVM的执行时间

svm.model <- svm(y ~., data = traindata, gamma = 0.01, cost = 10, kernel= "radial") 
+0

我会尝试子采样,也许1000-10000行,并看到什么样的性能,你得到的样本数量较少 - 这可能是足够的信息,以获得一个体面的模型。尝试不同的内核。 – zacdav

+0

是的,我确实尝试过。但是,与整个数据相比,采样大小为40K时,误差差异很大。 – user2991421

+0

你在做培训/测试,交叉验证等? – zacdav

回答

1

我建议尝试降低维数(以PCA为例),以减少功能的数量,从而提高性能。