2017-08-09 156 views
0

我使用Arules在R中运行Aprori算法。我有大量的数据可供挖掘,如果可能,我不想使用示例。我真的只需要看到与不常销售的商品相关的规则。Arules,范围内的支持

我使用现在的代码是:

basket_rules < - 先验(数据,参数=列表(SUP = 0.7,CONF = 0.2,目标= “规则”,列表(minlen = 4,MAXLEN = 7))

我只想与低点支撑的规则,但因为我的数据的大小和性质,我不能让任何低于0.7 是否有可能恢复的支持AA范围,以节省内存。

例如类似于:list(sup < = .05和> = 0001)

在运行Aprori时限制内存使用的任何其他想法都非常值得赞赏。

回答

1

支持性质(向下关闭)不允许您在特定范围内有效地生成仅支持项目集/规则。您总是必须先创建所有频繁项目集,然后在arules的R实现中筛选。 FP-growth或类似算法的实现可能会更有效地解决您的问题。

解决此问题的另一种方法是更仔细地查看数据。也许你有几件物品出现在很多交易中。这些项目对您而言可能并不感兴趣,您可以在挖掘规则之前将其移除。

+0

伟大的建议!我删除了一些最常见的项目,这让我更接近我想要的地方。谢谢。 – Coopa