2017-06-23 38 views
0

我正在使用Apriori构建推荐系统以配合我公司的应用程序。在走下这条路之前,我想向有更多经验的人证实我正处于正确的轨道上。任何帮助表示赞赏。市场购物篮分析 - 可变数量特征的单一模型?

让我试着解释这个问题。根据应用程序中用户的上下文,影响建议的功能可能会有所不同。例如,想象一下购物场景。如果我在HEB购物,我通常会有一个预定义的购物清单,所以如果我告诉应用程序我要去HEB,那么这个清单上的项目将是很好的建议。当我去Home Depot时,我倾向于按部门购物,所以如果我告诉我在家得宝的应用程序,并且正在购买电动工具,那么电动工具和相关部件是很好的建议。

您会发现在两种情况下功能的数量有所不同。首先,我的建议完全依赖于商店,而第二个则依赖于我所购物的商店和部门。

我期待使用一个Apriori模型来处理这种情况。这是否被认为是一种最佳做法,还是有不同的模式会更好?一种是当我们列出商店时,另一种是当我们列出商店和部门时?鉴于Apriori是一种无监督的算法,我认为它可以用一个模型来完成,但是由于我没有很多经验,所以我想仔细检查一下。

+0

如果您需要模型选择方面的帮助,您应该在[stats.se]处询问,而不是在这里。这似乎不是一个适用于堆栈溢出的特定编程问题。 – MrFlick

+0

好的,我没有意识到这一点。感谢您的意见。 –

回答

1

在我看来,你似乎在谈论多级关联规则。这是从aggregate功能的指南页arules

支持项目层次

说明:

通常一个项目层次可以用于 关联规则挖掘的数据集。例如,在超市数据集 中,诸如“面包”和“小猎犬”的项目可能属于项目组 (类别)“烘焙食品”。

我猜更高层次的类别是你的部门和商店。这将能够找到项目,部门和商店之间的关联。