2017-09-03 51 views
0

我正在尝试实现卷积神经网络(CNN)模型来分类手势。数据集不是现成的,因此我需要准备它。为卷积神经网络准备数据集

我应该如何准备数据集?我拍摄的图像是否应该包含手或除手之外的物体?哪个会给我一个准确的模型,可以准确的工作,尽管背景和框架中的其他物体?

回答

1

这里有一个例子: http://cims.nyu.edu/~tompson/NYU_Hand_Pose_Dataset.htm

它包含其他图像将仅仅意味着你必须实现东西你的管道隔离手。我会建议在图像中只有手,这样您就可以立即开始对图像进行建模。

很多cnn在这方面的架构使用多分辨率的CNNs。所以在您的数据准备中只需制作多个分辨率并输入到多输入CNN。你可以使用Keras功能性API做到这一点。低分辨率图像很适合区分某些非常不同的姿势,较高的分辨率可以关注较小的差异。

很明显,标准数据增加并不适合手势。像镜像或更改角度等内容可能会使您的数据不适合给定的标签。所以如果你没有那么多,那么对你的数据增加要保守一点。