我目前正在使用协同过滤的推荐系统。现在我正在研究一个适合电影推荐的高效算法。我很困惑,因为有许多像Pearson Correlation Coefficient这样的算法。所以我不知道要使用/实施什么。什么是协作过滤中使用的最好或最有效的算法?
你能给我一个好的/有效的算法吗?或者是一个给算法提供了一个很好的例子或模拟的网站? 感谢您的帮助!
我目前正在使用协同过滤的推荐系统。现在我正在研究一个适合电影推荐的高效算法。我很困惑,因为有许多像Pearson Correlation Coefficient这样的算法。所以我不知道要使用/实施什么。什么是协作过滤中使用的最好或最有效的算法?
你能给我一个好的/有效的算法吗?或者是一个给算法提供了一个很好的例子或模拟的网站? 感谢您的帮助!
给这篇关于netflix奖的文章一读Netflix Prize。通常,“最先进的”是矩阵因子分解的一些变体,例如OrdRec。查看Funk博客FunkSVD,它会给你一个关于实现CF的矩阵分解技术启动的简单解释。
矩阵因子分解(An example in Python)是一个很好的起点。此外,我建议使用Ed Chen's Blog和The Mining of Massive Datasets作为用于解决这类问题的各种方法的良好介绍。对于我使用这种类型的数据有趣的是稀疏的数量,当然有实际的限制,Emmanual Candes的论文似乎揭示了这个领域,优秀的先进工作。