我试过基于分布式推荐人作业的10M movielens数据集。一切正常。我的问题是,在检查用户的建议时,我看到在推荐的项目列表中有用户已评分的项目。更具体地说:Apache Mahout分布式推荐人推荐已评级项目
假设用户使用userid:4已经观看了具有以下ID的电影:[123,543,234,567,324],然后在推荐列表中再次出现543和234。我只是看着Mahout的行动来理解算法,我找不到一个代码段,它会在生成TopK列表之前消除已经评分的项目。我错过了什么,或者它推荐已经评分过的项目是否正常?
如果是正常的,是否有可能从候选物品中消除这些物品?
PS:过滤出的建议产生后的建议是不是有效的用于我的情况下,由于建议我想要数量为100并且对于一些用户滤波之后这个数目减小到30等
预先感谢。
感谢您快速回复肖恩。我使用了0.7版本的org.apache.mahout.cf.taste.hadoop.item.RecommenderJob。我会看看是否可以找到你提到的部分。如果没有,我就明白了。 – messe