1

假设有三列[“A”,“B”,“C”],我们可以指定拆分的顺序,以便首先拆分“A”类别,然后是“B”,然后由其他类别拆分?是否可以通过scikit-learn指定在决策树中分割的顺序?

根据DecisionTreeClassifier上的文档页面,没有这样的选项。有什么办法解决它?

http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html

+0

这是不可能的。树会自动选择在每个节点上减少基尼/熵标准的特征。 –

回答

0

这是不可能做到这一点。树会自动选择特征,方法是分析每个特征的差异并选择最有利的分割。

此外,如果您自己选择拆分,那么您的模型不会有效地执行。

+0

关于“高效”,它取决于数据。如果这些功能之间存在某种依赖关系,那么指定特定的顺序可能会有所帮助。 – Girishkumar

+0

@Girishkumar,不,它不依赖于数据。你是否明白算法的全部重点是找到最大化分裂效率的分裂?在机器学习中,基于启发式的确定性规则的应用导致比基于统计的规则更糟的结果。这就是ML开拓者称之为统计学习的原因。 – AN6U5

相关问题