-1
在我的数据集中,我有300k行,我做了70/30分割,结果似乎是一个好的模型,直到我查看真正的,假的 - 否定的,积极和真实的负面数字。为什么我有这么几个分类标签
TP是20,FN是2 FP是3和TN是41.
这是极低的?所以结果很好,但如果模型只能分类的话,90,000是无用的。
我该怎么做才能改善这一点?两类Boosted决策树或神经网络不会改变那么多结果。任何建议?
在我的数据集中,我有300k行,我做了70/30分割,结果似乎是一个好的模型,直到我查看真正的,假的 - 否定的,积极和真实的负面数字。为什么我有这么几个分类标签
TP是20,FN是2 FP是3和TN是41.
这是极低的?所以结果很好,但如果模型只能分类的话,90,000是无用的。
我该怎么做才能改善这一点?两类Boosted决策树或神经网络不会改变那么多结果。任何建议?
你能否检查一下你的数据集中是否有缺失值?
这是一个二元分类吗?你可以在这里分享实验链接吗? –