我一直在Andrew Ng的机器学习课程中做作业1。但是,当我将矢量化多变量梯度下降的时候,我被困在了他正在谈论的内容上。多变量梯度下降的矢量化
他的方程被表示为如下: THETA:= THETA - α* F
f为应该由1/M *总和(H(XI) - 基)*僖其中i是被创建索引
现在这里是我困惑的地方,我知道h(xi)-y(i)可以改写为theta * xi,其中xi代表一行特征元素(1xn),theta代表一列(nx1 )生成一个标量,然后我从y的单个值中减去该标量,然后乘以Xi,其中Xi表示1个特征值的列?
这样会给我mx1向量?然后必须从一个nx1向量中减去?
Xi代表一行特征值吗?如果是的话,我怎么能做到这一点,而不索引所有这些行?