我通过在线资源学习了梯度下降(即coursera上的机器学习)。然而,所提供的信息只表示重复梯度下降,直到收敛。渐变下降收敛如何确定收敛?
它们的收敛定义是使用成本函数相对于迭代次数的图形,并在图形变平时观察。因此,我认为我会做到以下几点:
if (change_in_costfunction > precisionvalue) {
repeat gradient_descent
}
另外,我在想,如果另一种方式来确定收敛观看系数法是真正的价值:
if (change_in_coefficient_j > precisionvalue) {
repeat gradient_descent_for_j
}
...repeat for all coefficients
所以基于收敛成本函数还是系数?我们如何确定精度值?它应该是系数或总成本函数的百分比吗?
趋同总是在你优化变量“没有变化”(或过小的变化),这在大多数情况下应该直接反映到您的成本上。 –