你如何使用加权综合评分中的特征权重？

我正在尝试为在线市场网站实施新的供应商排名系统。我想要做的是按照从最高到最低的综合分数对供应商进行排序。此刻，我想到的只是使用线性模型在计算分数的，有点像你如何使用加权综合评分中的特征权重？

score = w1 * f1 + w2 * f2 + w3 * f3....

其中F1，F2，...是不同的功能（例如，平均评价得分，取消订单速率，响应率等）和w1，w2 ...是这些特征的相应权重。

我想为每个商品的0-100分供应商评分，并根据此分数对商品进行排序。

我遇到麻烦的是找到一种方法来为每个功能分配最佳权重。有没有一种方法来分配权重以优化诸如可以说，用户购买的可能性或者像质量这样更为无形的东西？经过一些Google搜索后，我发现一些论文使用PCA创建一些复合索引。但由于我对PCA不太熟悉，我不完全确定它是否适合这种情况。

如果有人能够引导我走上正确的道路，我将非常感激。如果我以完全错误的方式处理这个问题，如果有人能够指出这一点，我将不胜感激。

2016-10-31 suzzant

这看起来像你的饼干监督学习问题。根据你是否有足够的标记数据，你可以使用一些简单的线性回归（http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html）或更复杂的东西如增强（http://xgboost.readthedocs.io/en/latest/python/python_intro.html）。你的数据标签可能是用户多久买一件东西，这使得这是一个回归问题。

2016-10-31 09:41:48

我明白了。我尝试用审查星标作为标签进行线性回归，结果看起来有些不错。我对助推不熟悉，所以，请稍微阅读一下。感谢您的帮助。 – suzzant

回答