如何减少SVM的执行时间

我目前正在处理具有20个特征和400K行的数据集。我正在使用e1071库进行使用SVM的多类分类。我有这个代码，需要大约2天的时间才能找到结果。有没有一种方法可以减少使用同一个库的时间复杂度？如果不是我最好在R中考虑哪些其他库或选项？如何减少SVM的执行时间

svm.model <- svm(y ~., data = traindata, gamma = 0.01, cost = 10, kernel= "radial")

我会尝试子采样，也许1000-10000行，并看到什么样的性能，你得到的样本数量较少 - 这可能是足够的信息，以获得一个体面的模型。尝试不同的内核。 – zacdav

是的，我确实尝试过。但是，与整个数据相比，采样大小为40K时，误差差异很大。 – user2991421

你在做培训/测试，交叉验证等？ – zacdav

我建议尝试降低维数（以PCA为例），以减少功能的数量，从而提高性能。

2016-10-21 03:26:08

回答