2016-12-07 23 views
8

我知道这个问题之前已经被问过好几次了,但是除了几个作者写的几个包之外,我没有在google上发现很多东西。无论如何,是否有计划将张力流中的roi pooling层(官方)包含在内,因为它是对象检测和其他任务的重要组成部分,而且无法访问它是使用tensorflow时的一个难题。有没有计划用于物体检测的张量流ROI池层?

欢迎任何评论或替代实施(如果验证)。

+2

它是快速(er)r-cnn的重要组件,不用于对象检测。还有其他的方法不使用它 - 看看https://arxiv.org/abs/1611.10012 – etarion

+0

感谢提及这篇论文,我会通过它。是的,我知道最近YOLO和SSD检测器已经被提出,能够在不需要明确区域的情况下进行检测。但是投资回报池也可以看作是一个标准模块,用于根据在实际图像空间中的位置来合并conv层中的要素。这超出了对象检测的用途,例如最近的视觉参考工作。 – ksikka

+0

再次感谢发送这篇文章@etarion,因为我看到在特征映射上使用调整大小裁剪过程实现了roi池化。我可以看到这是解决这个问题的另一种方法。 – ksikka

回答

8

我能用上面的文件找到我的问题的答案。您可以使用tf.image.crop_and_resize函数来裁剪网络的任何部分并调整其大小。类似于ROI池,可以裁剪一个边界框(按照下采样步骤的数量缩小,例如VGG16中的32个),并将其大小调整为N×N(例如VGG16中的7×7),然后可以将其馈送到完全连接层。