2016-06-20 85 views
1

有人可以解释在Matlab的岭回归函数中的比例因子吗?我发现了一个与用于缩放值的公式相关的帖子,但我不确定为什么我不确定它是如何工作的。当我将它设置为0时,我得到了典型的数字,但是我不得不输入截距为1的X矩阵。如果我包含一列,返回的b矩阵有一行太多,不能相乘。另一方面,当我将缩放因子设置为1时,我会得到完全不合理的值。有人可以解释发生了什么事吗?我可以怎样解决它?Matlab岭回归尺寸

b = ridge(Y,X,lambda,0); 
size(Y) = 
      444205  1 
size(X) = 
      444205  4 
size(b) = 
       5  1 

回答

1

ridge()自动居中和缩放X(对于每个特征,减去平均值,通过标准偏差除以),和中心y。令Xs表示X的居中/缩放版本,ys表示y的居中版本,b表示ridge()返回的权重。

scaled标志被设置为1,b给出了用于预测从Xsys的权重; ys的预测值由Xs * b给出。不需要一个常数项,因为Xsys居中。

scaled标志设置为0时,b给出了从X预测y的权重。 b的第一个元素包含一个常数项(因为Xy具有非零平均值,所以这是必需的)。 y的预测值由X * b(2:end) + b(1)给出。

有关此行为的更多信息,请参见documentation

+0

这解释了它。非常感谢! – Schmax