0
我试图在Weka中应用Apriori算法。
维基百科具有用于一个简单的例子(Apriori algorithm):在Weka中的Apriori算法中获取频率
alpha beta epsilon
alpha beta theta
alpha beta epsilon
alpha beta theta
以下关联规则可从该表来确定:与alpha
套
- 100%还含有
beta
- 50 %的套与
alpha
,测试版也有epsilon
- 50%套与
alpha
,测试版所以有theta
我转换这个项目分成CSV并添加另一个属性行,让我终于有了这个文件:
prod1,prod2,prod3
alpha,beta,epsilon
alpha,beta,theta
alpha,beta,epsilon
alpha,beta,theta
我装成Weka中,并点击标签“助理”,默认情况下选择“Apriori”算法。
结果我得到如下:
1. prod2=beta 4 ==> prod1=alpha 4 conf:(1)
2. prod1=alpha 4 ==> prod2=beta 4 conf:(1)
3. prod3=epsilon 2 ==> prod1=alpha 2 conf:(1)
4. prod3=theta 2 ==> prod1=alpha 2 conf:(1)
5. prod3=epsilon 2 ==> prod2=beta 2 conf:(1)
6. prod3=theta 2 ==> prod2=beta 2 conf:(1)
7. prod2=beta prod3=epsilon 2 ==> prod1=alpha 2 conf:(1)
8. prod1=alpha prod3=epsilon 2 ==> prod2=beta 2 conf:(1)
9. prod3=epsilon 2 ==> prod1=alpha prod2=beta 2 conf:(1)
10. prod2=beta prod3=theta 2 ==> prod1=alpha 2 conf:(1)
但我也希望频率在维基百科(见上文)的例子。