在非线性之前或Keras之后添加批量标准化？

def conv2d_bn(x, nb_filter, nb_row, nb_col, 
       border_mode='same', subsample=(1, 1), 
       name=None): 
    '''Utility function to apply conv + BN. 
    ''' 

    x = Convolution2D(nb_filter, nb_row, nb_col, 
         subsample=subsample, 
         activation='relu', 
         border_mode=border_mode, 
         name=conv_name)(x) 
    x = BatchNormalization(axis=bn_axis, name=bn_name)(x) 
    return x

当我在keras中使用官方inception_v3模型时，我发现他们在'relu'非线性之后使用BatchNormalization作为上面的代码脚本。在非线性之前或Keras之后添加批量标准化？

但是在批标准化论文中，作者说

我们添加BN立即把非线性之前，通过正火X =武+ B。

然后我查看tensorflow中的初始实现，它在非线性之前立即添加BN，正如他们所说的那样。 inception ops.py

我很困惑。为什么人们在Keras以外的地方使用以上风格？

def conv2d_bn(x, nb_filter, nb_row, nb_col, 
       border_mode='same', subsample=(1, 1), 
       name=None): 
    '''Utility function to apply conv + BN. 
    ''' 

    x = Convolution2D(nb_filter, nb_row, nb_col, 
         subsample=subsample, 
         border_mode=border_mode, 
         name=conv_name)(x) 
    x = BatchNormalization(axis=bn_axis, name=bn_name)(x) 
    x = Activation('relu')(x) 
    return x

在密集的情况下：

x = Dense(1024, name='fc')(x) 
x = BatchNormalization(axis=bn_axis, name=bn_name)(x) 
x = Activation('relu')(x)

来源

2017-02-21 daoliker

我也激活，这确实是它是如何设计的前使用它，所以做其他库，如烤宽面条的batch_norm http://lasagne.readthedocs.io/en/latest/modules/layers/normalization.html#lasagne.layers.batch_norm。

但是似乎在实践中把它放在激活后，工作好一点：

https://github.com/ducha-aiki/caffenet-benchmark/blob/master/batchnorm.md （这虽然只是一个基准）

来源

2017-03-22 11:06:26 gdelab

在非线性之前或Keras之后添加批量标准化？

回答

相关问题