0
我的数据集中有11个类/类别。对于每个班级都有一些实例分配给它。我需要知道Weka提取的每个类别的属性/单词以及分配给每个属性的数值。有没有办法做到这一点?如何从Weka获得每个类的属性
我的数据集中有11个类/类别。对于每个班级都有一些实例分配给它。我需要知道Weka提取的每个类别的属性/单词以及分配给每个属性的数值。有没有办法做到这一点?如何从Weka获得每个类的属性
这是Weka的训练和分类ARFF文件格式的样本:
在这种情况下,我在谈论Semeval 2014争夺西班牙使用的文件的一部分...
@relation Task10EnglishS2014
@attribute PathLenAlign numeric
@attribute ResAlign numeric
@attribute LcAlign numeric
@attribute WupAlign numeric
@attribute Res numeric
@attribute Lc numeric
@attribute DiceSimilarityAttribute numeric
@attribute NumericEvaluation numeric
@data
1,9.5852985,3.637587,1,8.0142254,3.637587,0.75,5.000
1,9.20881283333333,3.637587,1,8.3916004,3.637587,1,5.000
0.625,2.812914,2.754695,0.761905,2.812914,2.754695,0.5,0.292893218813452,0.300
...
零碎:
@relation Task10EnglishS2014
@relation +名称的一组或实验
@attribute LcAlign numeric
@attribute +从这里属性
@data
的属性+类型的名称,开始值的实例或向量为每个输入。
这是训练集,它用于训练分类新实例的模型。 在Weka资源管理器中,我们需要在预处理选项卡中加载此文件。在“分类”选项卡中,您需要选择一个分类器并设置10个折叠的交叉验证,然后单击“开始”按钮。这将生成训练有素的模型。
的ARFF分类文件必须具有以下结构:
@relation Task10EnglishS2014
@attribute PathLenAlign numeric
@attribute ResAlign numeric
@attribute LcAlign numeric
@attribute WupAlign numeric
@attribute Res numeric
@attribute Lc numeric
@attribute DiceSimilarityAttribute numeric
@attribute NumericEvaluation numeric
@data
1,9.5852985,3.637587,1,8.0142254,3.637587,0.75,?
1,9.20881283333333,3.637587,1,8.3916004,3.637587,1,?
0.625,2.812914,2.754695,0.761905,2.812914,2.754695,0.5,0.292893218813452,?
...
的?辛博尔意味着这是分类的价值。
他们必须选择选项:“提供的测试集”并选择文件进行分类,然后在“模式选项...”中选择“输出预测”,并在模型中右键单击并选择“重新评估模型在当前测试集上“。 在右侧面板中显示结果。
谢谢你的努力和解释。但是,我已经完成了培训步骤,并且我意识到分类步骤。我的问题是找到一种方法来知道我的数据集中的哪些属性被weka分配给哪个类(训练之后) –