2017-04-22 20 views
1

我有一个图像大小WxHx3需要分成21个类。使用CNN通过一些图层后,我获得了W/4 x H/4 x 512功能图。我们将最后使用ConvolutionalDeconvolutional图层将其与softmax图层中的标签进行比较。我有2个拓扑:哪种拓扑结构对于分割是正确的?

Softmax_loss         Softmax_loss 
    ^           ^
     |            | 
    deconv_layer         conv_layer 
    ^           ^
     |            | 
    conv_layer         deconv_layer 
    ^           ^
     |            | 
Intermediate_layers       Intermediate_layers 
    ^           ^
     |            | 
    Input           Input 

     (1)           (2) 

哪种拓扑更好?我见过他们两个。在FCN(完全卷积网络进行语义分割)中的第1号,VoxResNetUNet中的第2号。

回答

3

深度学习没有正确的方法。你通常会尝试一些事情,哪些事情最适合你。如果你按照fcn模型,它开始像conv->deconv->conv->deconv。在语义分割中大多数被引用的论文做conv->deconv。所以我也会建议1号。也直观地说,先做deconv没什么意义。

+0

是的。 FCN使用'conv(1x1,分类器) - > deconv'。然而,一些论文也使用'deconv-> conv(1x1)'像Unet,VoxResNet论文。所以我认为他们有一些理由 – KimHee

+0

@KimHee你确定Unet,VoxResNet首先执行'deconv'吗?我看到他们的prototxt文件,他们首先执行“conv”。如果你正在谈论最后要做什么,那么我认为最重要的是什么是最重要的。 – lnman

+0

Unet是conv_u0d-sc是lass prototxt的分类器。 https://lmb.informatik.uni-freiburg.de/resources/opensource/3dUnet_miccai2016_no_BN.prototxt。我的意思是之前的softmax图层过程 – KimHee