假设我有一个分类问题,它是多类的并且是特征分层的,例如, “食用”,“营养”和“〜有营养” - 所以它可以表示像这样scikit-learn中的多级分类问题的级联分类器
├── edible
│ ├── nutritious
│ └── ~nutritious
└── ~edible
尽管人们可以得到合理的性能,支持多分类的分类或使用一个-VS-一个/所有方案的那些不这样做,在每个级别单独训练分类器并连接它们可能也是有益的,因此被分类为“可食用”的实例可以被分类为nutritious
或不被分类。
我想用scikit-lean
估计为构建模块和我想知道如果我可以让Pipeline
支持这还是我需要写我自己的估计,实现基本估计,可能BaseEnsemble
做到这一点。
以前由@ogrisel在邮件列表http://sourceforge.net/mailarchive/message.php?msg_id=31417048中提到过,我想知道是否有人对如何进行此操作有任何见解或建议。
你最终做了什么? – Afflatus