0

我有一个数据集,包括三种类型的变量:自然状态,人类决策,响应变量。我试图用决策树学习来预测使用其他变量的响应变量。决策树学习可以“半监督”

我的心智模式是人们在看自然状态和做出决定。因此,我强烈希望通过根据自然变量的状态划分我的决策树,然后根据人类决策变量进行划分。我宁愿不只是在决策树模型中查找所有变量并查看弹出的内容。

该智能模型是否有效?如果是这样的话,我会如何使用Azure ML来实现这样的事情?我甚至不知道描述这个问题的正确词汇 - 这是“半监督”决策树学习吗?

回答

0

这里没有“半监督”部分。半监督意味着部分数据缺乏标签(响应变量),事实并非如此。您只需为决策树学习提出相当奇怪的约束,即可最终处理特征的子集。为了做这样的事情,你需要改变DT学习过程,或者最好 - 从头开始​​编码。 DT是非常简单的算法,它只需要很少的代码行,如果在里面,你的修改是简单的,它说“如果在根的路径上我们还没有使用所有有意义的'自然'特征,变成'人的决定'“。因此它非常简单,但我不认为任何库实际上都支持这种约束(因为它远不是自然的,特别是对于DT)。