我在MATLAB中用652500个数据点训练了我的artificial neural network(ANN),在另一个盲测中(652,100个数据点 - 对于全新的输入数据集)优秀(如我所愿)。但是当我插入的数据量非常少(例如,低于50个数据点)时会出现问题。输出是非常意外的,我检查了很多次。神经网络中的输出问题(在MATLAB的神经网络工具箱中)
更确切地说,培训阶段包含10%的培训数据,45%的验证和45%的测试。培训非常成功,而且对于大量新的输入数据,它的工作效果非常好。问题是当非常有限的数据(与训练数据点相比)被插入到神经网络中时,它显示出非常不切实际的输出,超出了训练的范围。
这是为什么?任何人都可以点亮一些棚子吗?
另外请提一下,在培训和最终测试数据点方面是否存在严格(严格和快速)的规则?例如:应该/必须在新的输入数据集中引入多少百分比的训练数据。我想问题在于我的网络高估或低估了输出,因为与训练阶段相比,它收到的数据的百分比非常低。
在分组之前尝试对数据进行洗牌,然后再查看该行为是否经常发生。这可能是因为数据空间没有在“有限数据”情况下用于测试的数据正确覆盖,并且当您有更多数据用于测试时,这些错误被其他人平均“掩盖”。 – damienfrancois
我明白你的逻辑,非常感谢。 我的数据集已经洗牌了。 – mmenvo