2017-05-01 89 views
0

我目前正在尝试使用卫星图像来识别苹果园。我在每个班级的代表性数据数量方面面临一个小问题。Keras - 二进制分类

其实我的问题是:

是否有可能在每个时期采取随机一些不同的图像,在我的“非苹果”类,因为我有更多的论文(与“苹果”一),我想增加我的网络将分类出一个不具代表性的图像的概率。

在此先感谢您的帮助

回答

0

那是不可能的Keras。 Keras默认会将您的训练数据进行混洗,然后以小批量方式进行训练。但是,仍然有办法重新平衡数据集。

您面临的不平衡的培训数据问题很常见。你有很多选择可供你选择;我在下面列出几个:

  1. 可以使用model.fit()功能class_weight关键字调整类的相对权重。
  2. 您可以“上样”您的“苹果”类或“下样”您的“非苹果”类,以在训练期间拥有相同数量的两个类。
  3. 您可以生成“苹果”类的合成图像以增强数据集。为此,Keras中的ImageDataGenerator类可能特别有用。这个​​是一个很好的介绍它的用法。

以我的经验,我发现#2和#3是最有用的。当使用相差几个数量级和较小批量的类别权重时,随机梯度下降的收敛受到影响,因此#1受到限制。

Jason Brownlee将a list of tactics for dealing with imbalanced classes放在一起,这可能对您也有用。

+0

谢谢!然后,我将增加我的苹果数据集,看起来好计划:) –