0

如果我们有K类,我必须绘制K个学习曲线吗? 因为我似乎不可能一次计算所有K theta向量的列车/验证错误。为了阐明,学习曲线是交叉验证/测试集错误/成本vs训练集大小的训练图。该图应该允许您查看增加训练集大小是否可以提高性能。更一般地说,学习曲线允许您确定算法是否存在偏差(拟合下)或方差(过拟合)问题。我应该为多类逻辑回归分类器绘制多少条学习曲线?

回答

0

这取决于。学习曲线不关心类的数量。就像你说的那样,这是一个训练集和测试集错误的图,其中错误是一个数值。这是所有的学习曲线。

该错误可以是任何你想要的:准确度,精确度,回忆,F1得分等(甚至MAE,MSE和其他回归)。

但是,您选择使用的错误是适用于或不适用于您的特定问题的错误,这反过来间接影响了您应该如何使用学习曲线。

任何数量的类的准确性都很好定义,所以如果使用这种方法,一个图就足够了。

但是,精确度和召回率仅限于二元问题。通过考虑类别为xnot x的二元问题,您可以稍微推广它们(例如,参见here),每个类别为x。在这种情况下,您可能需要绘制每个班级的学习曲线。这也将帮助您更好地发现与某些类别相关的问题。

如果您想了解更多关于性能指标的信息,我很喜欢this paper

+0

嗯我明白了,非常感谢您的帮助! –