我想在R.使用随机森林包分类R无规森林变量重要性
列出的变量重要性措施是:
- 意味着变量x的原始重要性得分为0类
- 平均原始重要性得分变量x的类1
MeanDecreaseAccuracy
MeanDecreaseGini
现在我知道这些“意思”是什么,因为我知道他们的定义。我想知道的是如何使用它们。
我真正想知道的是什么,这些值只有他们是多么准确,背景,什么是一个很好的价值,什么是不好的价值,什么是最大值和最小值等
意思如果一个变量的值很高MeanDecreaseAccuracy
或MeanDecreaseGini
这是否意味着它是重要的还是不重要的?此外,关于原始分数的任何信息也可能有用。 我想知道关于这些与它们的应用有关的数字的一切。
使用“错误”,“求和”或“置换”这些词的解释不会有帮助,那么简单的解释不会涉及随机森林如何工作的任何讨论。
就像我想让某人向我解释如何使用收音机一样,我不会期望解释涉及无线电如何将无线电波转换为声音。
请包含指向实际用于节点拆分的Gini定义的链接:http://en.wikipedia.org/wiki/Decision_tree_learning#Gini_impurity – tashuhka 2014-06-10 13:36:44