2015-03-30 43 views
0

我想为RandomForestTreeRegressor使用scinkit-learn的应用函数来获取每个学习树的叶索引的一些数据。我已经指定了max_depth为3,这应该导致最大叶子指数为4,但我实际上在40年代得到的数字要高得多。这有什么解释吗?关于scinkit-learn随机森林回归的叶索引

我想我的数据可能有些问题,所以我在scikit的页面上尝试了相同的示例代码,发现相同的问题。如果你想重现它,你可以在这里编辑源代码:http://bit.ly/1GHz1iG

回答

1

索引实际上覆盖树中的所有节点,而不仅仅是树叶。有高达2 ** max_depth叶子(这将是你的情况8,不知道为什么你期望4)。尽管所有节点都有编号,但数字可能会上升到2 ** (max_depth + 1) - 1