我想知道我们是否可以在sklearn.pipeline
中设置“可选”步骤。例如,对于分类问题,我可能希望在没有PCA
转换的情况下尝试带有AND的ExtraTreesClassifier
。实际上,它可能是一个具有额外参数的管道,用于指定PCA
步骤的切换,以便我可以通过GridSearch
等对其进行优化。我在sklearn源代码中看不到这样的实现,但是是否有任何工作 - 周围?是否可以在sklearn管道中切换某个步骤?
此外,由于管线中的随后的步骤的可能的参数值可能取决于参数在先前的步骤中(例如,ExtraTreesClassifier.max_features
有效值取决于PCA.n_components
),是有可能在sklearn.pipeline
指定这样的一个条件的依赖性和sklearn.grid_search
?
谢谢!
作为请注意,“ExtraTreesClassifier.max_features”可以是0.0到1.0之间的浮点值,而不是整数值。这在实际功能数量变化时很有用,就像你的情况一样。 –
谢谢你们两位有见识的答案。我认为他们正是我所期待的。 – dolaameng