2016-10-31 34 views
1

我正在尝试为在线市场网站实施新的供应商排名系统。我想要做的是按照从最高到最低的综合分数对供应商进行排序。此刻,我想到的只是使用线性模型在计算分数的,有点像你如何使用加权综合评分中的特征权重?

score = w1 * f1 + w2 * f2 + w3 * f3.... 

其中F1,F2,...是不同的功能(例如,平均评价得分,取消订单速率,响应率等)和w1,w2 ...是这些特征的相应权重。

我想为每个商品的0-100分供应商评分,并根据此分数对商品进行排序。

我遇到麻烦的是找到一种方法来为每个功能分配最佳权重。有没有一种方法来分配权重以优化诸如可以说,用户购买的可能性或者像质量这样更为无形的东西? 经过一些Google搜索后,我发现一些论文使用PCA创建一些复合索引。但由于我对PCA不太熟悉,我不完全确定它是否适合这种情况。

如果有人能够引导我走上正确的道路,我将非常感激。如果我以完全错误的方式处理这个问题,如果有人能够指出这一点,我将不胜感激。

回答

0

这看起来像你的饼干监督学习问题。根据你是否有足够的标记数据,你可以使用一些简单的线性回归(http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html)或更复杂的东西如增强(http://xgboost.readthedocs.io/en/latest/python/python_intro.html)。你的数据标签可能是用户多久买一件东西,这使得这是一个回归问题。

+0

我明白了。我尝试用审查星标作为标签进行线性回归,结果看起来有些不错。我对助推不熟悉,所以,请稍微阅读一下。感谢您的帮助。 – suzzant