conv-neural-network

    0热度

    1回答

    我正在训练约10,000张图片上的covnet,并注意到将优化器从opt = SGD()切换到opt = 'adam'会导致准确度大幅降低,保持所有其他参数相等。使用SGD(),我可以达到大约80%的准确率(每个时期后逐渐增加)。与亚当,我坚持在每个时代22.25%的验证准确性。 我想了解可能的原因是什么。 参数 dropout_prob = 0.2 activation_function =

    -1热度

    1回答

    当我添加了更强的正则化(例如L2正则化参数从1到10或退出参数从0.75到0.5)时,它给了我更慢和更差的性能(例如97-98%的测试精度在3000-4000次迭代中3000-4000次迭代只能达到94-95%的测试精度)。是否有这种情况发生的原因?我可以确认一切正确实施。谢谢! 编辑:我只是想说明我的程序有过度拟合(大约1%),而且看起来有没有退出,训练与测试精度之间的差异大致相同。

    -1热度

    1回答

    我想了解卷积神经网络,我正在看这个视频。 https://www.youtube.com/watch?v=FmpDIaiMIeA 我的印象是,当滤波器绕输入卷积时,每个点的输出表示特征与输入匹配得有多紧密。 然而,在这段视频中6:56显示了一个例子,其中7/9像素匹配(〜78%)视频中的输出为55%,与所用的叉积方法相匹配,但远不及78%我期望。另外,如果一个过滤器正在寻找每个像素为0的输入中的位

    0热度

    1回答

    我正在做一个项目,在Zynq Soc上映射经过训练的CNN。我用tensorflow训练Lenet并提取重量和偏差。据我观察,权重的值都接近0,几乎没有一个大于1.但lenet的输入数据是灰度图像,像素值是从0到255. 当我试图在输入图像和核心(训练权重)之间进行二维卷积,由于卷积结果都接近0,因此输出特征图全部为黑色图像。即使考虑到了Relu层,也是如此。但如下图所示,根据亮度,内核和特征映射

    0热度

    1回答

    我试图建立一个dcnn,但我得到这个错误: ValueError: ('The specified size contains a dimension with value <= 0', (-192, 1024)) 真的,我不知道这个错误的原因,这里是我的代码: 数据: c_X = open("C:/Users/PC/Desktop/Notebooks/Isabelle/mfcc_train_I_

    -1热度

    1回答

    我正在尝试使用Theano来实现CNN,并尝试使用我的较大数据集的小样本集来测试我的代码。我试图将一组8280张图片(250 * 250大小)分类成115个类别,而我的样本集合是前两个类别的32张图片(每张16张图片)。我遇到的问题是,从第一个时代开始,NaN的训练损失和它在更进一步的时代不会改变。 from __future__ import print_function import sy

    0热度

    1回答

    我试图训练一个CNN模型,2个类,它是基于张量流进行图像分类的。 我已经尝试了大量修改关于时代,学习速度,批量大小和CNN大小,但没有任何作品。 大约数据 86(标号:0)+ 63(标签:1)图像 形状:(128,128) 关于当前参数 learning_rate = 0.00005(我试过从0.00000001到0.8 ...) 批量大小= 30 历元(I也从5到130试过)= 20 有关网络

    0热度

    2回答

    有没有一种方法可以将来自使用多个内核大小的卷积层的输出进行组合(比如说最大值或平均值)?例如,如果我使用(2 * 2),(3 * 2),(2 * 3)而不是仅使用1个内核大小(2 * 3)的内核大小,并且在下一层中取平均值或最大值所有这些值的输出?

    0热度

    1回答

    我正在尝试使用tensorflow为1-d数据集上的应用程序创建CNN(convnet)。我的数据结构为浮动行,每个都有相关的一个热门目标(功能1,功能2 ...功能100; y_val) 我已经通过基本的多层感知器运行它,但要利用“地方”的特征空间,以及采取措施,通过统筹特征空间的“下采样”的优势,等 的问题是,我无法找到任何方式tensorflow做到这一点 - 无论是conv1d或conv2

    1热度

    1回答

    我想从零开始实现卷积神经网络,我无法弄清楚如何对像rgb这样的多通道图像执行(矢量化)操作,尺寸。在遵循诸如this CS231n tutorial的文章和教程之后,为单个输入实现网络是相当明显的,因为输入层将是3d矩阵,但是在数据集中总是存在多个数据点。所以,我无法弄清楚如何在整个数据集上实现这些网络的矢量化操作。 我已经实现了一个网络,它需要一个3d矩阵作为输入,但现在我已经意识到它不会在整个