2010-12-09 53 views
1

我不明白如何拆分CART(分类和回归树)算法中的连续属性,因为我们知道CART可以分割分类和连续属性。如何分割CART决策树算法中的连续属性?

我已经阅读了很多论文,它说分裂点的值是顺序的中间值。 我不明白。你能否向我解释这是什么意思,并举几个例子?

感谢

回答

1

的一般过程是通过候选分割值来扫描在任何给定的预测,测量每个分裂的质量,并选择最好的一个。为了提高效率,扫描可能不会尝试每个可能的分割,而是尝试每个百分点或其他一些缩减的选择。任何分割的质量都可以通过多种方式进行测量,例如信息增益,二值化等。

如果您正在专门讨论由Breiman,Friedman,Stone Olshen最初描述的CART算法,然后检查他们的书籍, “分类和回归树”(1984)。