我在TensorFlow上实现了全卷积网络。它使用编解码器结构。 训练时,我总是使用相同的图像尺寸(224x224
,使用随机裁剪),一切都很好。Dynamic Tensor Aligment/Cropping
在干涉阶段,我想一次预测一张图像,因为我想使用全图像(未被截取)。例如,这种图像的大小为[406,256]
。这是问题。 在编码器 - 解码器架构中,我添加了两个测试器(z = x + y)。训练时,两张张量的大小匹配。预测我的单张图像时,尺寸不匹配(张量尺寸:[1,47,47,64]
vs [1,46,46,64]
)。我认为这是Conv和Pool层完成一些舍入的原因。
我应该在我的架构中更改哪些图片以适合我想要的任何图片大小?我应该改变舍入参数吗?或者添加张量的“裁剪”?
链接到执行架构: https://gist.github.com/melgor/0e43cadf742fe3336148ab64dd63138f (问题发生在管线166)
只是调整你的输入到'[224,224]' –
我不想调整输入的大小,因为那样我就会失去一些空间信息。我的模型是通过正确的“纵横比”(没有图像调整大小)学习的。在干扰时,我也希望拥有正确的“长宽比”。 此外,我可以将图像分割成几个矩形区域,然后合并它。但我希望这个模型能够在不同的输入分辨率下快速合理地工作,并且能够在Mobile上工作 – melgor89