2016-05-29 355 views
1

我做的数据挖掘导论演习的泛化误差率,就死在以下有关决策树的问题:如何计算决策树

培训 Training

测试 Testing

决策树 Decision tree

这个问题让我用乐观和悲观的方法来计算泛化错误率,答案分别是0.3和0.5。 他们完全不同于我的答案0.5和0.7。根据我的计算,实例3,7,8,9,10是错误分类。 我在Google上搜索了很多文档,他们都没有解释为什么,只是显示3/10 = 0.3。 请告诉我我犯的错误,谢谢!

回答

0

你有这个毛病,missclassified是:

    培训
  • :3,5,6
  • 测试
  • :12,13,14,15

决策树是:

  • 返回+当且仅当(不是和不b)或(A和C)

因此例如3:

A = 0 B = 1 C = 0类= +,和你的DT回报 - 如A = 0且B = 1

1

我想你的答案是正确的,解决方案手册的答案是错误的,而且在复制树时出现错误 - 在本书的副本中,叶节点标签从左至右读取+, - ,+, - 。具有叶节点+, - , - ,+的树分别对于乐观和悲观错误估计分别为30%和50%。

使用叶节点+, - ,+, - ,错误确实是50%和70%。