2015-04-24 41 views
0

我的数据集中有11个类/类别。对于每个班级都有一些实例分配给它。我需要知道Weka提取的每个类别的属性/单词以及分配给每个属性的数值。有没有办法做到这一点?如何从Weka获得每个类的属性

回答

0

这是Weka的训练和分类ARFF文件格式的样本:

在这种情况下,我在谈论Semeval 2014争夺西班牙使用的文件的一部分...

@relation Task10EnglishS2014 

@attribute PathLenAlign numeric 

@attribute ResAlign numeric 

@attribute LcAlign numeric 
@attribute WupAlign numeric 
@attribute Res numeric 
@attribute Lc numeric 
@attribute DiceSimilarityAttribute numeric 
@attribute NumericEvaluation numeric 
@data 
1,9.5852985,3.637587,1,8.0142254,3.637587,0.75,5.000 
1,9.20881283333333,3.637587,1,8.3916004,3.637587,1,5.000 
0.625,2.812914,2.754695,0.761905,2.812914,2.754695,0.5,0.292893218813452,0.300 
... 

零碎:

@relation Task10EnglishS2014 

@relation +名称的一组或实验

@attribute LcAlign numeric 

@attribute +从这里属性

@data 

的属性+类型的名称,开始值的实例或向量为每个输入。

这是训练集,它用于训练分类新实例的模型。 在Weka资源管理器中,我们需要在预处理选项卡中加载此文件。在“分类”选项卡中,您需要选择一个分类器并设置10个折叠的交叉验证,然后单击“开始”按钮。这将生成训练有素的模型。

的ARFF分类文件必须具有以下结构:

@relation Task10EnglishS2014

@attribute PathLenAlign numeric 

@attribute ResAlign numeric 

@attribute LcAlign numeric 
@attribute WupAlign numeric 
@attribute Res numeric 
@attribute Lc numeric 
@attribute DiceSimilarityAttribute numeric 
@attribute NumericEvaluation numeric 
@data 
1,9.5852985,3.637587,1,8.0142254,3.637587,0.75,? 
1,9.20881283333333,3.637587,1,8.3916004,3.637587,1,? 
0.625,2.812914,2.754695,0.761905,2.812914,2.754695,0.5,0.292893218813452,? 
... 

的?辛博尔意味着这是分类的价值。

他们必须选择选项:“提供的测试集”并选择文件进行分类,然后在“模式选项...”中选择“输出预测”,并在模型中右键单击并选择“重新评估模型在当前测试集上“。 在右侧面板中显示结果。

+0

谢谢你的努力和解释。但是,我已经完成了培训步骤,并且我意识到分类步骤。我的问题是找到一种方法来知道我的数据集中的哪些属性被weka分配给哪个类(训练之后) –