2013-02-25 158 views
-1

我想推荐被标记的商品,并将其分为三个价格类别(便宜,普通和昂贵)。我知道,用Mahout的建议可以实现,但这就是为什么我不知道如何使用它。我应该使用mahout吗?

Mahout基于其他用户的意见,但我想推荐的所有新项目都只是没有任何偏好设置的新项目。

Mahout是正确的工具吗?这是基于内容的吗? (哪个mahout不支持呢?)还是应该使用分类?

谢谢!

+1

你确定要推荐模型而不是某种聚类方法吗? (从你的问题看来你所有的数据都是新的 - 所以基本上你没有任何训练集) – xhudik 2013-02-27 09:03:43

+0

我真的不知道,如果我想要这个或分类。我仍然在阅读,我甚至不知道该怎么办 – 2013-02-27 16:55:43

回答

1

因为我从来没有任何建立推荐系统 - 不要把这个答案很严重(没有人已经回答了这个问题,所以我尽量)

推荐系统,必须对一些已知建(或部分已知的数据)。如果您只有新的(不可见的)数据,则只能使用某些聚类算法来构建一些聚类。

如果这些群集可以的话,它们可以用来训练一些推荐系统。

Mahout只是一个实现各种ML方法的工具。您可以使用其他工具,如Weka,R,...

+0

那么,我试图创建的这个算法将基于之前收集的数据,但必须应用到新的数据。 – 2013-02-28 10:51:08

+0

我想,我会去集群,因为这对我来说听起来更好:) – 2013-02-28 10:51:25

+0

我推荐coursera的推荐系统课程:https://class.coursera.org/ml-2012-002/lecture/index(week IX:推荐系统) - 你需要注册 – xhudik 2013-02-28 13:56:12

0

如果您根本没有关于新用户的数据,那么无论您做什么,都无法提出建议。没有任何输入可以将人与其他人区分开来。

好的系统应该能够在第一个输入可用后做一些合理的事情。

这不是天生的分类器问题,没有。尽管如此,它也不是一个集群工具。

价格类别不是您使用的任何rec流程的核心。你可能有其他数据,它是什么?这很重要。

最后是否使用Mahout取决于口味。如果你想使用Java和Hadoop,你可以使用它。反过来,如果您有非常大的输入,那么您只会考虑Hadoop,并且很少有人拥有那么多的数据(至少像> 10M数据点)。

(当然,不是很 - 我推荐作品在Mahout的预日期Hadoop和是上线,规模较小的应用程序,您可能确实有兴趣在此,如果你是在Java中工作。)