我刚刚阅读了关于Wired团队BellKor的实用混沌团队是怎样的winning the Netflix Challenge,我很好奇这种算法通常如何工作。我知道Bellkor团队的解决方案必须是现场创新的解决方案。但该领域通常如何运作?它只是一个真正详细的数据库,马尔可夫链一次又一次地运行或者是什么?自动推荐算法通常如何工作?
回答
但如何外地平时工作?
这是一个数据挖掘技术。数据挖掘被用作商业智能(数据仓库等)的一部分,试图找到大量数据中的关系和信息。它是计算机科学的一个领域,通常也涉及机器学习,例如模式识别。自动推荐通过Association Mining获得。作为建议显示高支持度的关联。 k最近邻算法只是机器学习/数据挖掘人员使用的众多算法之一。
如果你有兴趣在基础理论,我由伊恩·H·威滕建议Data Mining: Practical Machine Learning Tools and Techniques。
对于Java,有一个很棒的机器学习软件包,WEKA能够做到association mining。 Ian Witten也是WEKA的作者之一。
看看这篇维基百科文章:Euclidean Distance。
的基本想法是,你使用距离度量(如上面的欧几里得一个)来比较的人或事物彼此。
新O'Reilly出版的书Programming Collective Intelligence: Building Smart Web 2.0 Applications对这个题目一个伟大的篇章。
我在Wired上发现了this previous article,它简要地提到了过去由Bellkor和Cinematch使用的k-nearest-neighbor algorithm。
心理学家对如何找到偏见所做的观察也很有趣。
大多数Netflix竞赛参赛者在Singular Value Decomposition上使用变体。该算法通过采用大矩阵并将其简化为近似2×2矩阵来操作。这个2x2矩阵然后可以绘制在二维空间上,其中彼此靠近的点在原始矩阵中彼此共享亲和力。
因此,就Netflix而言,您可以创建一个矩阵,其中电影是列,用户是行,其中任何值[i,j]是i用户给予电影j的评级。这是一个非常大的矩阵,然后可以应用SVD生成一个二维矩阵,用作较大矩阵的近似值。当在这架飞机上绘制时彼此接近的用户共享相似的评级,所以如果一个用户没有看到另一个用户在这架飞机上看过的人接近它的电影,那么这可能是对新用户的推荐。
获胜溶液设计被叫SVD ++直SVD算法的变型和混合,它们一起与其他边缘情况,试图产生一种算法,将超出的领奖所需的10%的改进。
- 1. 推荐算法
- 2. 如何实现这个推荐算法?
- 3. 推荐算法中的协作过滤
- 4. 为什么不通过推荐工作?
- 5. 实现推荐算法
- 6. 如何让Mahout推荐工作更快?
- 7. 推荐autoslider不工作
- 8. 如何自动排除推荐算法中已经访问的项目?
- 9. Jquery推荐推子不能正常工作
- 10. SOLR - 自动推荐词
- 11. 工业推荐的移动测试自动化工具
- 12. 推荐方法来并行化多通道算法
- 13. 你如何计算网上的推荐?
- 14. 3D Pathfinding AI算法推荐和分析
- 15. 推荐算法编程拼图
- 16. 请推荐一些Python散列算法
- 17. 推荐新内容的算法
- 18. 推荐模板匹配算法
- 19. 推荐本地搜索优化算法
- 20. 在C#微博推荐算法
- 21. 基于关键字的推荐算法
- 22. 电视节目推荐算法和SQL
- 23. 在PHP中推荐/结合算法?
- 24. 简单建议/推荐算法
- 25. 通过Firebase无法正常工作的iOS推送通知
- 26. Apache Mahout推荐程序不能正常工作
- 27. 自动完成 - 无法正常工作
- 28. 推送通知不能正常工作
- 29. Redmine + bzr的推荐工作流程?
- 30. 推荐的Eclipse EGit工作流程
另一种方法是曼哈顿距离(或Taxicab几何)(计算速度快,欧几里得精度较低) – adhg 2013-04-06 21:37:32