2017-06-14 142 views
0

在训练我的模型时,当我使用类似sklearn.model_selection.train_test_split(X, y, stratify=y, train_size=0.9)sklearn.model_selection.StratifiedKFold(n_splits=10)之类的东西时,我得到的结果截然不同,并且想知道他们如何对数据进行分层。我几乎可以肯定,我根据文档实现了一切,但奇怪的是,后者给出的测试精度比第一个差得多。StratifiedKFold与train_test_split分层之间的区别

+0

你能发布一个我们可以尝试和复制你的行为的最小完整代码吗? –

回答

0

stratify不是无train_test_split在内部使用StratifiedShuffleSplit,而不是StratifiedKFold。所以是的,有很大的不同。

+0

@hyperdo此外,明显的区别在于StratifiedKFold会给出10倍不同的列车和测试数据,而train_test_split只会给出一个。 –