我打算实施一个CNN,该CNN可以使用NYU深度v2数据集来估算单幅图像的深度。通过教程已经向我表明,实施一个处理Caffe分类问题的CNN是很容易的。我很好奇,如果Caffe适合于涉及多维地面真理(例如深度图像)和回归(深度估计)的任务。Caffe上的多维标签数据
我想要实现的是使用深度图像作为基础事实来训练可以估计深度图像的CNN。我需要将标签加载为单通道图像数据。
我只能找到Shelhamer这个答案是有关我的问题https://groups.google.com/d/msg/caffe-users/JXmZrz4cCMU/mBTU1__ohg4J
我知道我应该定义了两个顶层,一个用于输入,另一个用于深度数据的地面实况。然后我可以使用损失层(如EucledianLoss)来计算损失。我在下面添加了一个模型。
该模型是否按预期工作?如果不是,还有其他方法可以在Caffe上做到吗?
layer {
name: "data"
type: "ImageData"
top: "data"
image_data_param {
source: "input_set.txt"
batch_size: 50
}
}
layer {
name: "label"
type: "ImageData"
top: "label"
image_data_param {
source: "depth_set.txt"
batch_size: 50
}
is_color: false
}
layer {
name: "loss"
type: "EuclideanLoss"
bottom: "some_output_layer_name"
bottom: "label"
top: "loss"
}
您是否完成了结果?我一直在尝试同样的事情。但我无法想出一个解决我的问题的网络。 – thigi