2013-05-30 85 views
0

关于使用Weka的鲍鱼数据集的ANN和KNN。性能评估,错误或准确性的最佳标准?

结果为安 正确分类实例3183 76.203% 正确分类实例994 23.797% 平均绝对误差0.214 均方根误差0.3349 相对误差绝对值58.6486%

结果为KNN | 正确分类实例3211 76.8734% 正确分类实例966 23.1266% 平均绝对误差0.2142 均方根误差0.3361 相对误差绝对值58.7113%

KNN具有测量精度高,但ANN具有低的错误。那么我应该说哪两种算法更好?哪一个更为可取的标准,准确性或错误?我的理解是错误应该以较高的准确度降低。但这里的结果是相反的。为什么这样呢?

回答

1

答案取决于您是否想将问题视为分类(正如您使用的算法所示)或回归。如果这是一个分类问题,那么你应该只考虑正确/不正确分类实例的百分比。否则,错误。

为了解释,正确分类的实例的百分比只考虑预测是否准确,即预测2而不是1与预测10000不一致。推理是你得到的数据类错误而且阶级之间没有差别的概念。另一方面,对于回归,您预测连续数量和差异的大小。也就是说,如果实际值为1并且预测2,则该模型比预测为10000时好得多。

这样,您可以通过更差的错误或反之亦然获得更好的准确性。会发生什么是你总体上会得到更加正确的预测,但是那些错误的将会进一步恶化。

要使用哪种性能衡量标准取决于您的特定应用。你只关心是否预测了正确的课程,还是关于正确预测的距离?如果后者是这种情况,我会建议使用回归而不是分类模型。

+0

谢谢你的解释良好的答复。有一个问题,当我们使用分类模型时,为什么Weka显示错误呢?就像它是无用的,因为分类任务将不会太大程度上困扰,对! –

+0

击败我。我想总是显示一切更容易。 –