2013-05-31 164 views
4

我有一组文件,每个文件都包含一个唯一的标识符。我用编程方式使用Weka,并创建一个训练变量文件。 arff文件中的每个实例都对应于我从每个文件中提取的一组属性,因此每个文件一个实例。如何将每个文件的标识符与arff文件中的相应实例链接起来。非常感谢你提前。Weka中的ID属性

+0

我不完全明白的问题 - 你尝试只需添加一个新功能,拥有标识? – kutschkem

+0

为了更加清晰,您可以添加代码片段吗? – Chris

回答

4

您可以通过创建额外的属性as described here将标识符与每个实例相关联。

因此,你的情况,你会创建一个字符串属性,并将此属性添加到每个实例。在训练和测试分类器时,您需要删除标识符,该标识符可以使用Remove Type Filter(默认情况下会删除字符串类型)轻松完成;删除过滤器也可以在指定属性索引的地方起作用。

如果您使用命令行运行Weka,则可以使用-p选项来输出预测和属性(即使是对已过滤的属性)。请参阅第一个链接的底部。

1

如果我没有误解,你想链接2个或更多的arff文件在一起。

我们假设我们有两个名为​​3210和file2.aff的arff文件。

您可以通过在命令行中使用下面的代码:

java weka.core.Instances append file1.arff file2.arff 

干杯