我正在挖掘一些数据。 我想节省时间。 那么任何方法?任何一种优化Apriori算法的数据挖掘算法?
1
A
回答
1
- 使用正确的编程语言(EX:用VB可能是灾难性的)
- 制定您所需要的信息和代码的相应
- 计划减少数据库的大小或准备数据库根据您的需要
- SUPER计算机(硬件是没有的事,玩笑归玩笑,你需要一个非常大的数据集尤指良好的计算机)
提高Apriori算法本身:
•基于散列的项目集计数:相应的散列存储桶计数低于阈值的k项目集不能很频繁。
•事务减少:在随后的扫描中不包含任何频繁的k-itemset无效的事务。
•分区:数据库中可能频繁出现的任何项目集都必须在数据库的至少一个分区中频繁出现。
•抽样:在给定数据的子集上进行挖掘,降低支持阈值+确定完整性的方法。
•动态项目集计数:仅在估计所有子集都频繁时才添加新的候选项目集。
2
如果你是挖掘数据,你想节省时间,你应该考虑使用,而不是试图优化先验FPGrowth。
即使您优化Apriori,它也不会像FPGrowth的良好实施一样快。
Apriori很重要,因为它是第一个用于频繁项目集挖掘和关联挖掘的算法。但现在有一些更高效的算法。
相关问题
- 1. Apriori算法挖掘XML文档
- 2. 哪种数据挖掘算法最好?
- 3. 数据挖掘算法比较
- 4. 建议这种情况的数据挖掘算法
- 5. DBSCAN算法和数据挖掘聚类算法
- 6. 数据集Apriori算法
- 7. 关于一些数据挖掘算法的问题
- 8. 在数据挖掘中映射数据的算法
- 9. 简单的比特币挖掘算法
- 10. Weka Apriori算法
- 11. Pseudo-Apriori算法
- 12. Apriori算法差
- 13. R数据挖掘语法
- 14. 向前看的时间分析,R(数据挖掘算法)
- 15. Apriori算法的超市数据集
- 16. 对类别数据的Apriori算法
- 17. 斜率一种算法,优化查询
- 18. 优化算法,在同一种
- 19. 引用url地址学习数据挖掘算法C5.0
- 20. 关于Apriori算法
- 21. Weka Apriori算法转换数据集
- 22. 优化算法
- 23. 算法优化
- 24. 算法的优化
- 25. 算法的优化
- 26. 循环数据的优化算法
- 27. 优化数据库的搜索算法
- 28. 挖掘众包数据的合法性
- 29. scipy.optimize.leastsq使用哪种优化算法?
- 30. 数据挖掘:Apriori问题。最小支持