我试图使用SciKit-Learn来执行我的第一个KNN分类器。我一直在关注用户指南和其他在线示例,但有几件事我不确定。对于这篇文章,您使用以下 X =数据 Y =目标 1)在大多数的介绍,我读过它似乎在说你想要一个训练集,验证集机器学习的网页,和一套测试装置。根据我的理解,交叉验证允许您将训练和验证集合在一起以训练模型,然后您应该在测试集上对其进行测试以获得分数。但是,我在论文中看到,在很多情况
我正在观看这个着名的Intro to Stat Learning课程中的video关于在特征选择中进行交叉验证的内容。 教授们说,在进行任何模型拟合和特征选择之前,我们应该形成褶皱。他们还表示,在每一次拆分中,我们最终都会得到一组不同的“最佳预测指标”。我的问题是,如果是这种情况,我们如何确定未来使用的总体最佳预测指标。换句话说,如果我有一组新的数据,我怎么知道我应该使用哪些预测指标?
首先我想说我在发布之前搜索了很多东西,但没有发现关于geting得分大于1.0(100%)的任何内容。 所以首先我使用GridSearchCV来选择我的模型,但是我没有使用gamma参数,因为GridSearch被卡住了。这里是我的代码: from sklearn.svm import SVR
from sklearn.model_selection import GridSearchCV