我已经开始使用scikit-learn决策树并且目前为止它工作得很好,但我需要做的一件事是检索样本集叶节点的Y值,特别是在运行预测时。给定一个输入特征向量X,我想知道叶节点处相应Y值的集合,而不仅仅是这些值的平均值(或中值)的回归值。当然,我们希望样本均值具有小的变化,但我想提取实际的Y值集合并进行统计/创建PDF。我已经使用了这样的代码how to extract the decision rules from scikit-learn decision-tree? 要打印决策树,但“值”的输出是表示均值的单个浮点数。我有一个很大的数据集,因此将叶子大小限制为例如100,我想访问这100个值...scikit-learn决策树回归:检索所有样本的叶子(不是意味着)
0
A
回答
0
另一种解决方案是使用sklearn DecisionTreeRegressor对象的(未记录的?)特征,即.tree.impurity 它返回每个叶子的值的标准偏差
+0
虽然这可能是解决问题的有价值的提示,但一个好的答案也可以证明解决方案。请[编辑]提供示例代码来展示你的意思。或者,可以考虑将其写为注释。 –
相关问题
- 1. 决策树与Logistic回归
- 2. Estadd意味着多个回归
- 3. Python决策树回归修剪
- 4. 有什么方法可以在决策树的每个叶下获取样本?
- 5. 输出选择的决策树叶
- 6. pyspark决策树中的样本权重
- 7. Logistic回归在scikitlearn
- 8. 决策树vs朴素贝叶斯vs Apriori算法和多元回归模型
- 9. proc意味着在所有列sas
- 10. 什么是chrome.identity.getProfileUserInfo意味着返回?
- 11. Scikit-Learn自定义决策树叶子类型
- 12. '$?'是什么意味着在bash脚本?
- 13. shell脚本意味着
- 14. 大O而不是小O意味着Theta?同样,大欧米茄和不小欧米加意味着Theta?
- 15. 决策树中的递归编程
- 16. 递归排序算法的决策树
- 17. 问题中的递归决策树
- 18. 递归cte - 标记所有叶子
- 19. '!'是否意味着perl?
- 20. %是什么〜DP0意味着
- 21. 这是&意味着什么?
- 22. 是否意味着perforce中的所有文件?
- 23. Haskell:返回一个多路树的所有叶子?
- 24. %,这意味着
- 25. 检查叶子c是否与叶子a和叶子b在同一子树中的最有效算法
- 26. 决策树和贝叶斯网络有什么区别?
- 27. 的Java + =意味着
- 28. 全文搜索意味着将所有内容都转换为文本?
- 29. 音频采样率意味着什么
- 30. 的DeviceIoControl()返回的数据意味着
你需要像这样的东西:http://scikit-learn.org/stable/auto_examples/tree/plot_unveil_tree_structure.html#sphx-glr-auto-examples-tree-plot-unveil-tree-structure-py –
你可以使用'apply'来获取每个样本的叶子ID; [见这里。](https://stackoverflow.com/questions/38299015/getting-the-distribution-of-values-at-the-leaf-node-for-a-decisiontreeregressor/38318135#38318135) –
谢谢你这些答复。我将它编码并得到与用graph_viz导出树时显示的相同的意思,所以这很好。不过虽然紧凑,但看起来效率不高。我有效地将数据拟合到一棵树上,并且每个叶节点最终将有一组子样本。然后我再次迭代数据以记录它落入哪个叶节点,以便我可以获取相应的目标。但是这些数据应该已经存储在叶节点的某个地方了?它似乎并不慢,所以也许不值得担心重复。 – user1978816