2011-01-06 158 views
25

我想知道机器学习中的学习曲线是什么。绘制它的标准方式是什么?我的意思是我的阴谋的x轴和y轴应该是什么?什么是机器学习中的学习曲线?

+1

从来没有听说过的更好学习曲线。你的意思是ROC曲线? http://en.wikipedia.org/wiki/Receiver_operating_characteristic – Stompchicken 2011-01-06 17:07:32

+4

不,学习曲线和ROC曲线不是同义词,因为我试图在下面描述。 – MattBagg 2012-12-05 02:16:04

+0

@MattBagg:你绝对是对的,我回到编辑之前。 – Amro 2013-01-20 01:18:27

回答

34

我认为它通常是指预测精度/误差的主场迎战训练集大小曲线(即:如何更好的模型是否获得在预测目标,你的增加用来训练它的实例数)

alt text

13

有些人使用“学习曲线”来表示迭代过程的误差作为迭代次数的函数,即它说明了一些效用函数的收敛。在下面的例子中,我绘制了作为迭代次数函数的最小均方(LMS)算法的均方误差(MSE)。这说明了在这种情况下,LMS“学习”信道冲激响应的速度有多快。

learningcurves.png

7

基本上,机器学习曲线,让你找到该算法开始学习点。如果你开始建立自己的学习能力,那么在开始达到常数的时候,你需要一条曲线,然后切出一个斜率作为导数。

根据您的x和y轴的映射方式,您的一个轴将开始接近恒定值,而另一个轴的值​​将不断增加。这是当你开始看到一些学习。整个曲线几乎可以让你测量算法能够学习的速率。最高点通常是斜坡开始退后的时候。您可以采取一些衍生指标来衡量最高点/最低点。

所以从上面的例子中你可以看到曲线正逐渐趋向一个常数值。它最初通过训练实例开始利用它的学习,并且斜坡在最大/最小点处变宽,并趋向于越来越接近恒定状态。此时,它可以从测试数据中挑选新的示例,并从数据中找到新的独特结果。 你会有这样的x/y轴测量时代与错误。

27

我只想留下一个关于这个老问题的简短说明,指出学习曲线和ROC曲线不是同义词。

如在其它这个问题的答案所指示的,学习曲线常规描绘在当有另一个参数变化(在横轴上),如训练集的大小,纵轴性能改进(在机器学习)或迭代/时间(在机器和生物学习中)。一个要点是模型的许多参数在图上的不同点上都会发生变化。其他答案在说明学习曲线方面做了很多工作。 (工业制造学习曲线还有另一个含义,起源于20世纪30年代的观察结果,生产单个单位所需的劳动时数以统一的速度减少,因为制造单位的数量增加了一倍。是不是真的相关,但值得一提的完整性,避免在网络搜索混淆)

相比之下,ROC曲线,或ROC曲线,并不表明学习。它显示了性能。ROC曲线是分类器性能的图形描述,其显示了随着分类器的鉴别阈值变化而增加的真正阳性率(在垂直轴上)和增加的假阳性率(在水平轴上)之间的折衷。因此,与该模型相关的只有一个参数(判定/判别阈值)在图上的不同点发生变化。该ROC曲线(from Wikipedia)显示了三种不同分类器的性能。

ROC curve, see previous link for CC licensing

无法在这里被描绘的学习,但对于相当表现两种不同类别的成功/错误的作为分类的决策阈值变得更加宽松/严。通过查看曲线下面的区域,我们可以看到分类器区分类的能力的总体指示。这个曲线下面积指标对这两个类别中的成员数目不敏感,因此如果班级成员不平衡,它可能不会反映实际表现。 ROC曲线有很多字幕,有兴趣的读者可以看看:

Fawcett, Tom. "ROC graphs: Notes and practical considerations for researchers." Machine Learning 31 (2004): 1-38.

Swets, John A., Robyn M. Dawes, and John Monahan. "Better decisions through Science." Scientific American (2000): 83.

2

你怎么能确定给定的模型更多的培训点是否会有帮助?一个有用的诊断是学习曲线。

•情节的预测准确度/误差与训练集的大小(即:如何更好的模型是否获得在预测目标,你使用的增加数量的实例来训练吧)

•学习曲线通常描述了当另一参数(横轴)发生变化时,例如训练集大小(机器学习中)或迭代/时间,垂直轴上性能的改善

•学习曲线通常对绘图用于算法健全性检查或提高性能

•学习曲线绘制可以帮助诊断问题,你的算法将

亲自痛苦,下面的两个链接帮助我理解这个概念

Learning Curve

Sklearn Learning Curve