2017-03-04 29 views
-1

在我的数据集中,我有300k行,我做了70/30分割,结果似乎是一个好的模型,直到我查看真正的,假的 - 否定的,积极和真实的负面数字。为什么我有这么几个分类标签

TP是20,FN是2 FP是3和TN是41.

这是极低的?所以结果很好,但如果模型只能分类的话,90,000是无用的。

我该怎么做才能改善这一点?两类Boosted决策树或神经网络不会改变那么多结果。任何建议?

+0

这是一个二元分类吗?你可以在这里分享实验链接吗? –

回答

0

你能否检查一下你的数据集中是否有缺失值?