2014-12-27 111 views
0

我正在使用Weka作为我的项目。 我有两个数据集: “?”Weka测试集显示0个实例

  1. train.arff - - > 20个属性和1类
  2. test.arff> 20个属性和类被标记为

我训练了模型的百分比拆分,并将模型保存到NaiveBayes.model。然后加载模型,选择Supplied测试集,检查Output Predictions并根据当前测试集重新评估模型。

结果表明:

=== Predictions on test set === 

inst#, actual, predicted, error, probability distribution 

=== Summary === 

Total Number of Instances    0  

=== Detailed Accuracy By Class === 

       TP Rate FP Rate Precision Recall F-Measure ROC Area Class 
       0   0   0   0   0   ?  6.0 
       0   0   0   0   0   ?  5.0 
       0   0   0   0   0   ?  7.0 
       0   0   0   0   0   ?  4.0 
       0   0   0   0   0   ?  2.0 
       0   0   0   0   0   ?  1.0 
       0   0   0   0   0   ?  3.0 
       0   0   0   0   0   ?  NA 
Weighted Avg. NaN  NaN  NaN  NaN  NaN  NaN  

但实际上,我有2000条记录test.arff。

任何人都可以帮忙吗?谢谢!

+1

如果您使用的是GUI,在分类标签我会选择“更多选项”,并启用“输出的预测”。如果它实际上预测测试实例,这可能会给你一些洞察。我怀疑它是,但不报告结果,因为它不知道它的预测是否正确(因为有问号) – Walter

+0

[Weka忽略未标记的数据]的可能重复(http://stackoverflow.com/questions/ 16432121/WEKA-忽略-未标记数据) – Sentry

回答

0

就像沃尔特已经指出的,Weka需要知道实际的课程,告诉你它有多好。如果您想重新评估模型,则测试集中的类别标签不得将设置为未知

看到这个问题和答案,它应该帮助你。如果没有,告诉我们为什么,我们试图找出答案。

Weka ignoring unlabeled data