我们如何使用'rpart'包来指定参数'minsplit ='来执行决策树。如何在决策树中使用rpart决定'minsplit'?
rpart包(myFormula,数据=火车,控制= rpart.control(minsplit = 10))
我们如何使用'rpart'包来指定参数'minsplit ='来执行决策树。如何在决策树中使用rpart决定'minsplit'?
rpart包(myFormula,数据=火车,控制= rpart.control(minsplit = 10))
minsplit: - 其必须存在于一个节点,以便分割要被尝试的观测值的最小数目。 (https://stat.ethz.ch/R-manual/R-devel/library/rpart/html/rpart.control.html)
您可以通过指定您自己的值来覆盖minsplit控制参数。但请注意,这可能会导致过度拟合决策树。例如,如果您的数据点不足以创建RPART默认参数集的树,那么你可以调整minsplit,minbucket的值来创建一棵树。
您可以在查看数据集后决定数值。
RPART的默认值: - 。minsplit = 20,minbucket =圆形(minsplit/3)
树< - rpart包(结果〜,方法= “类”,数据=数据,控制= rpart.control( minsplit = 1,minbucket = 1,cp = 0))