2015-06-26 63 views
0

MATLAB特征选择算法reliefF的输出是RANKED和WEIGHTS。MATLAB ReliefF输出

http://in.mathworks.com/help/stats/relieff.html

如何在两个输出有关吗?

+0

阅读文档时,究竟有什么不清楚的地方? –

+0

从文档,'排名= 重量= 0.1399 0.1226 0.3590 0.3754 第四预测器是最重要的,并且所述第二预测值是最重要的。 '级别和权重如何相关? – Sumit

回答

2

从文档:

排名是按属性重要性排序在X列的索引,这意味着排名(1)是最重要的预测指数。 WEIGHT是属性权重,范围从-1到1,分配给重要属性的大正值权重。

所以relieff不只是给你一个预测指标最重要的清单,它还给你一个权重列表,让你知道预测指标的重要性。例如,WEIGHT(4)是第四个预测变量的权重。 WEIGHT(RANKED)将按排名(从最高到最低)返回有序的权重列表。

您会注意到,在这种情况下,预测变量的权重值实际上相对接近。这可能表明,虽然对于这组特定的数据,第四个预测变量似乎排在第一位,第四个和第三个预测变量都很重要,并给出了排名可能改变的不同数据集。

例如,fisheriris数据集包含150个四个预测变量的测量值。如果我们把他们的只有三分之二,我们可以得到不同的结果:

load fisheriris 
[ranked,weight] = relieff(meas(1:100,:),species(1:100),10) 

这给我们:

ranked = 3 4 2 1 weight = 0.1574 0.2265 0.5431 0.4981 

上有relieff引用in the documentation三个学年论文。如果你真的想了解它正在做什么的细节,你应该尝试抓住这些。