回答
你可以去星火MLlib算法。 Spark提供机器学习算法,该算法通过使用用户,产品和评分进行训练。在你的情况下,评级将是一件物品的购买次数(用户购买一件物品的次数)。
您可以按照此处显示的示例Collaborative filtering - ALS直接转到ALS算法。
您可以使用Cos协方差和相关性。
https://github.com/Krewn/KPlot/blob/gh-pages/analysisTools.py
请您介绍一下吗?或者Java代码 –
在java中我可能会从这里开始,http://commons.apache.org/proper/commons-math/javadocs/api-3.6.1/index.html – kpie
亨利马乌已基于所述概率数似然比(LLR)的用户和项目相似性,这已被证明相比于其他相似的度量,得到优异的性能,并且仅在名义上“相似性”,实际上是一种相关性测试。 Mahout中的LLR会为每个检测到的事件(数据集中的行)生成一个分数。该数据收集在spark-itemsimilarity
作业的“指示器”矩阵中。您可以将其与搜索引擎一起用于创建推荐人或使用我们为PredictionIO创建的推荐人。
PredictionIO是一个带有数据库,工作流控制以及存储和计算引擎集成的机器学习服务器。请参阅Universal Recommender,它使用Spark上的Mahout,并且是一个功能齐全的端到端推荐器,可以查询基于用户的建议。
谢谢。我用对数似然比。但它忽略了购买记录。我在考虑是否可以根据购买记录改进推荐系统。因为如果用户多次购买商品,则可能表示用户喜欢商品更多。 –
您可能会认为,但我已经使用tanimoto进行了交叉验证实验,tanimoto是使用矢量长度(购买数量),余弦(不使用长度但使用购买次数)和LLR节拍的主要相似性指标这两方面都有很大的优势。这是来自大型在线零售商的真实世界ecom购买数据。这是因为购买数量往往不表示偏好,这表明产品像现在一样持久(除臭剂和红牛的罐头;-)。 – pferrel
- 1. 如何根据文档集合计算文档相似度?
- 2. 如何计算jaccard相似度
- 3. 计算余弦相似度
- 4. 计数相似的记录
- 5. SQL计数相似记录
- 6. 根据记录类型计算总和
- 7. Google Play购买记录
- 8. 如何计算多类型数据的余弦相似度?
- 9. 如何计算来自熊猫数据帧的jaccard相似度
- 10. 根据请求记录计算打印的计算器
- 11. 如何根据信用记录计算信用评分
- 12. 如何根据特定值计算组记录?
- 13. 如何根据计算对记录进行排序Rails
- 14. iPhone - 应用程序内购买:记录购买
- 15. LibGdx:无需购买即可加载购买记录()
- 16. 句子相似度 - 如何使用WordNet计算subsumer的深度?
- 17. 方法来计算相似度
- 18. 计算稀疏矩阵的相似度
- 19. 计算NSStrings中的相似度
- 20. python中的wordnet相似度计算
- 21. 计算权重的相似度得分
- 22. 计算加权树的相似度
- 23. 计算mahout中的余弦相似度
- 24. 计算两个列表的相似度
- 25. 使用Python计算余弦相似度
- 26. 计算余弦相似度,如果数据包含NA值
- 27. 如何根据这些标准订购数据库记录?
- 28. DataFrame计算平均购买价格
- 29. 如何使用对数似然度量与数学公式计算相似度?
- 30. 根据类似的值计算行数
非常感谢。我会去尝试一下。 –