2016-11-17 32 views
0

我正在观看这个着名的Intro to Stat Learning课程中的video关于在特征选择中进行交叉验证的内容。交叉验证是特征分类中的选择

教授们说,在进行任何模型拟合和特征选择之前,我们应该形成褶皱。他们还表示,在每一次拆分中,我们最终都会得到一组不同的“最佳预测指标”。我的问题是,如果是这种情况,我们如何确定未来使用的总体最佳预测指标。换句话说,如果我有一组新的数据,我怎么知道我应该使用哪些预测指标?

+0

欢迎来到SO!这个问题不是关于编程,所以不适合这个网站。你最好在[交叉验证](http://stats.stackexchange.com) – Tchotchke

回答

0

初学者的好问题。 您的问题的答案是使用同一组功能以供将来使用。是的,选择的功能可能随时间而改变。但通常情况下会随着之前选择的功能而变化。 但重要的是,用于特征选择的初始数据应该足够好,并具有足够数量的样本,以便它能够反映出几乎所有的问题。如果是这种情况,通常所选的功能对新测试数据的改变也不会太大。