交叉验证是特征分类中的选择

我正在观看这个着名的Intro to Stat Learning课程中的video关于在特征选择中进行交叉验证的内容。交叉验证是特征分类中的选择

教授们说，在进行任何模型拟合和特征选择之前，我们应该形成褶皱。他们还表示，在每一次拆分中，我们最终都会得到一组不同的“最佳预测指标”。我的问题是，如果是这种情况，我们如何确定未来使用的总体最佳预测指标。换句话说，如果我有一组新的数据，我怎么知道我应该使用哪些预测指标？

来源

2016-11-17 Long Ngo

欢迎来到SO！这个问题不是关于编程，所以不适合这个网站。你最好在[交叉验证]（http://stats.stackexchange.com） – Tchotchke

初学者的好问题。您的问题的答案是使用同一组功能以供将来使用。是的，选择的功能可能随时间而改变。但通常情况下会随着之前选择的功能而变化。 但重要的是，用于特征选择的初始数据应该足够好，并具有足够数量的样本，以便它能够反映出几乎所有的问题。如果是这种情况，通常所选的功能对新测试数据的改变也不会太大。

来源

2017-02-01 11:06:58 prashanth

交叉验证是特征分类中的选择

回答

相关问题