我正在学习mahout中的fpgrowth,我找到了频繁项目集的出生函数,但是如何使用mahout形成频繁项目集的规则?它不是在mahout中实现吗?如何使用mahout形成频繁项目集的规则
1
A
回答
0
从频繁模式计算规则相当容易,并且可能不会从并行和分布中获益很多。毕竟,预计数据中的频繁模式数量会少得多。
因此,在Mahout之外做这件事可能会快很多,这取决于您拥有的频繁模式的数量。
0
Mahout并不专门用于模式挖掘。
您可以检查SPMF软件:http://www.philippe-fournier-viger.com/spmf/index.php(我是作者)。
它拥有超过45种与频繁项目集和关联规则挖掘相关的算法的Java源代码。
它包括一些经典算法,如FPGrowth的算法。但它也提供了几种专门的算法,这些算法在其他数据挖掘工具中找不到,例如用于挖掘稀有项目集,可擦除项目集,高效用项目集,来自不确定数据的项目集等等。
例如,许多不同类型的关联规则,您可以尝试旁边的“经典”关联规则,如:封闭关联规则,关联规则的信息和通用基本规则,顺序规则等。
它是根据GPL对于一些最流行的算法有一个简单的GUI界面,如果你有任何问题,你可以在论坛发帖,我会尽力回答你。
相关问题
- 1. 如何根据来自支持的初始频繁项目集生成关联规则?
- 2. 计算交易中重复项目的频繁项目集
- 3. 查找频繁项集
- 4. 从封闭频繁项目集生成计数
- 5. 如何使用Orange3从CSV文件中的列中提取频繁项目集?
- 6. 协会规则,频繁模式挖掘
- 7. 频繁集和关联规则 - Apriori算法
- 8. 关联规则挖掘和频繁项目挖掘有什么区别
- 9. Mahout Hive集成
- 10. 集成使用梯形规则用C给予某些价值
- 11. 频繁项集挖掘的性能
- 12. 为什么apache Mahout频繁模式minnig算法只返回1个项目itemsets?
- 13. 检查是否使用规定的规则集形成字符串
- 14. C#linq,获取集合中最频繁的项目
- 15. 如何查找频繁的项目集而不考虑属性名称?
- 16. 生成WSDL /规则项目时出错
- 17. 如何将Hadoop与Mahout集成?
- 18. 如何从数据库中选择最频繁的项目?
- 19. 如何使用mysql查询从表中选择最频繁的项目?
- 20. 频繁使用asynctask
- 21. Drupal规则/分类集成?
- 22. 辛普森规则集成
- 23. 频繁项目集与推荐系统中基于项目的协作过滤相比如何?
- 24. 频繁项目过滤器使用红宝石
- 25. 如何将Mahout KMeans集群集成到应用程序中?
- 26. 数据库和应用程序设计的频繁项集生成
- 27. PMD与Maven - 如何禁用规则集中的一个规则?
- 28. 如何使用R计算项目集的频率?
- 29. 使用规则集文件
- 30. Hbase 0.96与Mahout 0.9集成
谢谢,但它不是我想要的 – whiletrue 2012-07-19 00:35:11
在mahout中,只有他们所谓的“并行FP增长”才能找到项目集。找到项目集后,没有用于生成关联规则的算法。如果你想找Mahout的规则,你需要自己实现它。此外,请注意,他们所称的“并行FPGrowth”与原始FPGrowth有点不同。 Mahout中的版本挖掘了top-k项目集,而不是使用minsup阈值挖掘项目集。 – Phil 2012-07-31 14:28:55