cross-validation

1热度

1回答

我正在尝试使用K = 5来制作K倍CV回归模型。我尝试使用“boot”包cv.glm函数，但是由于引导包总是在它旁边计算一个LOOCV MSE，所以我的内存耗尽了内存。所以我决定手动做，但我遇到了以下问题。我尝试将我的数据框分成5个长度相等的矢量，其中包含我的df的1/5的rownumbers样本，但是我从第3个折叠中得到无法解释的长度。 a <- sample((d<-1:1000), size

1热度

2回答

创建自定义褶皱插入符CV

我使用的插入符包模型和交叉验证 model <- caret::train(mpg ~ wt + drat + disp + qsec + as.factor(am), data = mtcars, method = "lm", trControl = ca

1热度

1回答

为什么ShuffleSplit比train_test_split更多/更少随机（with random_state = None）？

考虑以下两个选项介绍： #!/usr/bin/env python3 # -*- coding: utf-8 -*- #sklearn.__version__ 17.1 #python --version 3.5.2, Anaconda 4.1.1 (64-bit) #ipdb> TypeError: __init__() got an unexpected keyword argum

2热度

2回答

R mlr - 无需嵌套嵌套交叉验证的包装特征选择+超参数调整？

在mlr中，可以使用嵌套交叉验证来进行过滤器特征选择以及超参数调整，例如，用下面的代码。 lrn = makeFilterWrapper(learner = "regr.kknn", fw.method = "chi.squared") ps = makeParamSet(makeDiscreteParam("fw.abs", values = 10:13), makeDisc

4热度

1回答

Scikit-learn中KNN分类器中的网格搜索参数和交叉验证数据集

我试图使用SciKit-Learn来执行我的第一个KNN分类器。我一直在关注用户指南和其他在线示例，但有几件事我不确定。对于这篇文章，您使用以下 X =数据 Y =目标 1）在大多数的介绍，我读过它似乎在说你想要一个训练集，验证集机器学习的网页，和一套测试装置。根据我的理解，交叉验证允许您将训练和验证集合在一起以训练模型，然后您应该在测试集上对其进行测试以获得分数。但是，我在论文中看到，在很多情况

0热度

1回答

交叉验证是特征分类中的选择

我正在观看这个着名的Intro to Stat Learning课程中的video关于在特征选择中进行交叉验证的内容。教授们说，在进行任何模型拟合和特征选择之前，我们应该形成褶皱。他们还表示，在每一次拆分中，我们最终都会得到一组不同的“最佳预测指标”。我的问题是，如果是这种情况，我们如何确定未来使用的总体最佳预测指标。换句话说，如果我有一组新的数据，我怎么知道我应该使用哪些预测指标？

0热度

1回答

如何矢量化这段代码以便从文件加载交叉验证？

所以我应该从文件中加载交叉验证折叠（10次迭代，每次迭代10次，因此总共100次，按顺序存储在1维数组中）。这里是文件：https://www.mediafire.com/?bvs0n0eu7gs0if4。问题是我的代码使用循环集约，我想vectorise吧，这里是我的代码： input_filename = 'cv_yeast.mat'; cv = load(input_filename);

3热度

1回答

交叉验证返回1.0以上的分数我应该怎么做？

首先我想说我在发布之前搜索了很多东西，但没有发现关于geting得分大于1.0（100％）的任何内容。所以首先我使用GridSearchCV来选择我的模型，但是我没有使用gamma参数，因为GridSearch被卡住了。这里是我的代码： from sklearn.svm import SVR from sklearn.model_selection import GridSearchCV

3热度

2回答

Keras和交叉验证

我目前正在尝试训练使用keras的回归网络。为了确保我进行适当的训练，我想使用交叉验证进行训练。问题是，似乎keras没有任何支持交叉验证的功能，或者他们呢？我似乎找到的唯一解决方案是使用scikit test_train_split并手动为每个k折叠运行model.fit。是不是已经有了一个完整的解决方案，而不是手动完成？

0热度

2回答

如何定义每个k次折叠的大小？

我目前正在使用交叉验证训练我的回归网络，我没有任何标签，但是应该映射到特定输出的具体输入，然后网络应该生成映射。我似乎在折叠正在被定义。我做交叉验证的方法是这样的： ############################### Training setup ################################## #Define 10 folds: seed = 7 np.