有人能让我知道,如果这是计算我的分类器的交叉验证精度的正确方法吗?我将我的数据集分为xtrain和ytrain作为训练数据,并将ytest作为测试集。如何在python/sklearn中从Random Forest中验证我的预测?
构建模型:
RFC = RandomForestClassifier(n_estimators=100)
其拟合训练集:
RFC.fit(xtrain, ytrain)
这是我不能确定的部分约:
scores = cross_val_score(RFC, xtest, ytest, cv = 10, scoring='precision')
使用上面的代码,将“分数”给我的训练数据上的训练模型的精度?我非常害怕我习惯了错误的代码,并且我正适合xtest的模型,因为我的测试数据的回忆和精确度分数高于我的训练数据的分数,我无法弄清楚为什么!