2017-09-16 64 views
0

我试图绘制使用rpart包,其输出中真的很困惑决策树一个不寻常的决定树输出(多类)。值得注意的是,在第三节点,农业和采矿班怎么能从城市生产?如何解释使用软件rpart

我觉得应该是农业和城市,而不是农业和采矿业。 这里是我的代码

df<-read.csv("https://raw.githubusercontent.com/tuyenhavan/Statistics/Dataset/Landsat_Data.csv") 

library(rpart) 

library(rpart.plot) 
set.seed(123) 

dt<-rpart(Land_cover~., data=df) 

rpart.plot(dt,cex=0.35) 

请帮我解释一下。谢谢

回答

0

节点显示所有响应类别的相对频率与多数表决沿,即最常见的类别。如果有联系,那些最常见的类别中的第一个显示为多数票(当然,这有点随心所欲)。

因此,在根节点的所有类别的20%的相等频率和“农业”发生被显示为多数表决,因为它是按字典顺序第一类。

类似地,在节点3(用于频带1> = 0.03599656) “城市” 和 “水” 仍然并列为最频繁的类别(200个观测= 24.969%)。因此“城市”被列为多数票。