2016-08-08 179 views
1

我刚刚开始了解Adaboost的决策树,并在OpenCV上尝试了它,并且有一些问题。Adaboost决策树/树桩

提振决策树

我明白,当我使用的Adaboost与决策树,我不断地拟合决策树训练数据重新加权版本。分类是通过加权多数投票完成的

当用Adaboost训练决策树时,我可以使用Bootstrapping吗?即我们选择数据集的子集并在将分类器馈送到Adaboost之前在每个子集上训练一棵树。

提振决策树桩

我用同样的技术决策树桩?或者,我可以创建等于功能数量的树桩吗?即如果我有两个具有10个特征的类,那么在将分类器送入Adaboost之前,我会为每个特征创建总共10个决策树桩。

+0

为什么这个问题不在datascience.SE? – alexeykuzmin0

回答

2

AdaBoost不仅在不同的子集上训练分类器,还根据达到的汇编性能调整数据集元素的权重。详细描述可以在here找到。

是的,你可以使用相同的技术来训练决策树桩。该算法大致如下:

  1. 在没有权重的初始数据集上训练决策残块(与每个权重为1的元素相同)。
  2. 使用AdaBoost算法中的公式更新所有元素的权重。正确分类元素的权重应该变小,不正确分类的权重 - 变大。
  3. 使用当前权重训练决策树桩。也就是说,不仅要减少这个决策失误的错误数量,还要减少错误的总和。
  4. 如果没有达到所需的质量,请前往pt。 2.