2014-06-28 102 views
-6

假设ANN已经使用很长时间训练了1GB大小的训练数据。 训练数据中只有几行改变时,我们是否需要重新训练数据? 还是ANN误差的设计?更新ANN的训练集

+0

为什么只是削减我的分数?任何人都可以给我一些关于这个愚蠢问题的建议。 – smart

回答

2

一般来说,答案是肯定的。这是为什么...

首先,1GB的训练数据是一个相对的测量,因为它没有给出训练样本的数量指示。也许每个训练样本的大小为1MB(可能是一张图片),只剩下大约1000个样本,其中可能是还不够。其次,了解神经网络的结构以便充分解决再训练问题很重要。如果您的训练集中已更新的组件对应于可能在使用方面受到严重影响的节点,那么重新训练肯定是按顺序进行的。当然,反过来并不一定是真实的,因为神经网络的相互关系可能会受到输入变化的影响,可能并不是很明显。第三,神经网络意味着代表一种复杂的模式匹配器,训练识别一些输入关系,并产生一个可能的输出关系。从这个天真的观点来看,投入的变化肯定会对应于产出的变化。因此,训练数据的变化可能非常符合预期输出数据的变化。而且,即使不这样做,输入模式也会发生变化,这可能意味着输出模式也发生了变化。

让我们考虑下面的例子。假设你的神经网络进行训练,以配合艺术家的绘画作品,它已经成功制作the following match to Leonardo da Vinci

enter image description here

现在,它可以被训练不够好,还断言,以下图片是“画”同一艺术家:

enter image description here

enter image description here

这可能是因为你对你的青睐训练有素的神经网络迭代乐高塑像的气球过去时间。但是,现在您的一些输入样本发生了变化,特别是那些与蒙娜丽莎相关的样本。相反,他们像你的新宠过去的时间...徒手鼠标绘制:

enter image description here

尽管你说的话,一般来说,上述图像的艺术并没有真正匹配的以往试验。因此,您的模式匹配器可能无法正确认识到这是达芬奇制作的艺术作品。因此,公平地说,对这种图像进行再培训应该是有条不紊的。


你可能有多种选择:

  1. 测试它的效果如何在给定的训练数据的变化重新培训你的神经网络。这将允许你自己回答这个问题,并且对你的神经网络的体系结构有一定的了解。

  2. 重新调整你的神经网络的变化,这可能被认为是新的训练数据。它的价值可能在很大程度上取决于你的架构,样本的复杂程度以及培训数量(而不是规模)。

  3. 执行完整的再培训并测试功效。

+0

亲爱的我的朋友沃纳,我发布了一个关于这个问题的新问题。 – smart

+0

亲爱的沃纳,我发布了一个新的[问题](http://stackoverflow.com/questions/24478069/face-recognition-with-nn)。谢谢! – smart