机器学习：按重要性加权训练点

我有一组标记的训练数据，我正在训练ML算法来预测标签。但是，我的一些数据点比其他数据点更重要。或者，类似地，这些点比其他点的不确定性更少。机器学习：按重要性加权训练点

是否有一种通用方法在模型中为每个训练点添加重要性代表权重？是否有一些具有这种能力的具体模型，而其他的则不是？

我可以想象复制这些点（也许稍微涂抹它们的特征以避免精确重复）或下采样不太重要的点。有没有更好的方法来解决这个问题？

2017-10-06 n3utrino

Scikit-learn允许您在拟合模型时传递样本权重数组。 Vowpal Wabbit（一个在线ML库）也有这个选项。

2017-10-06 18:25:48 Prateek

回答