我正在使用德国交通标志检测基准数据库进行交通标志识别工作。这有43个班级,每个班级至少有400张图片。图像最多可以有3个交通标志。为卷积神经网络选择训练和验证集对测试精度有很大影响
当我随机选择了用于训练和验证集的图像时,我在网络测试精度上获得了巨大的差异。我构建了两个数据集:一个具有75%的训练图像和25%的验证图像;另一个有70%的训练图像和30%的验证图像。
我正在使用GoogLeNet和相同的超参数进行训练,其中包括30个时代。
训练结束后,我测试了一组不同的用于测试的图像。使用第一个数据集,我比第二个数据集准确度低了近10%。有人能解释这一点吗?
难道它是随机选择“更容易”的图像进行训练,这就是为什么我得到较低的结果?
P.S.对于这两个数据集,我使用的是相同的图像,只是按百分比划分。
链接到数据集:http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset
10%或10%点?您是否多次尝试过两个数据集,或者只尝试过一次? –
请更改您的问题:很难理解您的设置和结果。 – Shai
如果我正确理解你,你使用一个数据集的随机分割和使用**不同的**组图像进行测试的训练和验证? – Shai