2017-05-24 51 views
0

我使用scikit学习的梯度升压树木分类,GradientBoostingClassifier。它使得功能重要性得分可用feature_importances_。如何计算这些要素重要性?功能重要性如何计算GradientBoostingClassifier

我想了解什么算法使用,以帮助我了解如何解释这些数字scikit学习。该算法未在文档中列出。

+0

它记录在这里:http://scikit-learn.org/stable/modules/ensemble.html#feature-importance-evaluation – EdChum

+0

谢谢,@EdChum!原来,这是不太正确的链接(你给的链接是RandomForests和ExtraTrees的文档),但它帮助我找到GradientBoostingClassifier答案。我写了一个解释的答案。谢谢你的帮助! –

回答

1

这个scikit学习文档中记载elsewhere。特别是,在这里是如何工作的:

对于每个树,我们计算一个特征F作为样本,将遍历分裂基于特征F节点(见here)的部分的功能重要性。然后,我们平均在所有的树木(如描述here)这些数字。

它没有描述究竟如何scikit学习的估计,将遍历上的功能分割F.

的解释树节点节点的分数:分数将在范围[0,1]。分数越高意味着该功能更重要。不要指望得分总和为1;他们没有这样规范化。