2015-04-18 34 views

回答

0

这可能不是您正在寻找的答案,但您可以尝试每个答案,并根据一些测试数据进行验证。编写脚本应该是相当简单的。

我不知道选择特征选择算法的更好方法,但它会偏向您使用的测试数据。

+0

我测试了它们中的每一个,并对它们进行了交叉验证。是的,这绝对取决于数据,但如何根据数据属性或性能选择特征选择方法?你有什么想法?谢谢 – Kun

0

这些answers may help

我对特征统计的假设是:类之间的值之间的最大距离和一个类的值的最小方差将一个好的特征分类。

我从小型学习集开始,测试这个假设,并在结果看起来很有希望时增加学习集。

最终优化是平均值比较的直方图。具有相似直方图的特征被删除。那些冗余特征会降低(至少在SVM上)精度相当(5-10%)。

使用这种方法,我在5个类的数据集(600个实例)上获得了95%的准确性。培训需要< 1小时。经过多天的实验,手动培训获得了98%的成功。

+0

我想你的方法与PCA(主成分分析)类似,我之前使用它来减少特征。是的,我已经用SVM测试了一些特征选择方法,它们具有不同的性能。 – Kun