2017-10-06 95 views
1

我有一组标记的训练数据,我正在训练ML算法来预测标签。但是,我的一些数据点比其他数据点更重要。或者,类似地,这些点比其他点的不确定性更少。机器学习:按重要性加权训练点

是否有一种通用方法在模型中为每个训练点添加重要性代表权重?是否有一些具有这种能力的具体模型,而其他的则不是?

我可以想象复制这些点(也许稍微涂抹它们的特征以避免精确重复)或下采样不太重要的点。有没有更好的方法来解决这个问题?

回答

1

Scikit-learn允许您在拟合模型时传递样本权重数组。 Vowpal Wabbit(一个在线ML库)也有这个选项。

相关问题