2017-10-20 45 views
1

我正在尝试构建cnn模型(keras),它可以根据用户的情绪对图像进行分类。我遇到数据问题。我有非常小的训练数据。增加数据会有帮助吗?它是否提高了准确性?在这种情况下,应该选择增加数据,并应该避免?图像增强是否有帮助?

回答

2

将增加数据帮助吗?它是否提高了准确性?

这很难预先说明。但几乎可以肯定的是,当你已经有一个比随机更好的模型。当你选择正确的增强方法。

查看我的硕士论文Analysis and Optimization of Convolutional Neural Network Architectures,第80页了解许多不同的增强方法。

在这种情况下,应选择增加数据,并应避免?

  • 当你没有足够的数据 - >增强
  • 避免扩充,你不能告诉隆胸后的情感。因此,在字符识别的情况下,轮换是一个坏主意(例如由于6 vs 9u vs n\rightarrow vs \nearrow
+0

谢谢,我会参考。 – Afrid

2

是的,数据增加真的有帮助,有时它确实是必要的。 (但看看马丁托马的答案,那里有更多的细节和一些重要的“关心”)。

时,您应该使用它:

  • 你有太少的数据
  • 您发现您的模型过学习太容易(可以是一个模型太强大太)

过拟合是什么当你的模型能够记住数据时会发生这种情况。然后它对训练数据的准确度非常高,但对测试数据的准确性很差。

增加训练数据的大小会使模型难以记忆。这里和那里的小变化会让你的模型停止关注那些没有任何意义的细节(但能够创造图像之间的区别)并开始注意确实会产生所需效果的细节。

+0

做缩放,缩放和旋转就足够了增强,或者我们也可以玩的渠道和直方图均衡? – Afrid

+1

如果不尝试一些增强就足够了,你不能说。更有趣的问题是如果他们改进模型。而且这也是非常问题,模型和数据集具体(+1为答案) –

+0

的确,@MartinThoma。 –