tensorflow

0热度

1回答

我们已经培训了一个tf-seq2seq模型来回答问题。主要框架是google/seq2seq。我们使用双向RNN（GRU编码器/解码器128单元），增加了软关注机制。我们将最大长度限制为100个字。它大多只产生10〜20个单词。对于模型的推断，我们尝试两种情况：正常（贪心算法）。其推断时间约为40ms〜100ms 光束搜索。我们尝试使用波束宽度5，其推断时间约为400ms〜1000ms。所

2热度

2回答

为什么有些python变量是大写而其他是小写？

我经常看到大写和小写单个字符变量。我不确定是否选择了案例，因为变量是一个类的实例，float32，或者只是个人偏好。以下是Tensorflow入门指南的示例。 https://www.tensorflow.org/get_started/get_started W = tf.Variable([.3], dtype=tf.float32) b = tf.Variable([-.3], dtyp

1热度

1回答

如何打印tensorflow中的梯度和值？

self.logits = nn_layers.full_connect_(self.wide_deep_embed, config.num_classes, activation='None', use_bn = True, \ keep_prob=self.keep_prob, name='output_layer') # predict prob ## loss

0热度

1回答

在Keras 2.0上使用合并图层（lambda /函数）？

我试图端口this模型为Keras V2，但我有以下功能相关的问题： def __call__(self, sent1, sent2): def _outer(AB): att_ji = K.batch_dot(AB[1], K.permute_dimensions(AB[0], (0, 2, 1))) return K.permute_dimensions

0热度

1回答

Conv3D不起作用

我建立了一个使用conv3d的张量流模型，冻结它并为推理进行了优化。当我把在Android上的推理（TensorflowInferenceInterface.run），我收到以下错误： java.lang.IllegalArgumentException: No OpKernel was registered to support Op 'Conv3D' with these attrs. Re

1热度

1回答

如何实现卷积神经网络的L2正则化成本函数

我已经实现了CNN数字分类模型。我的模型过度配合，为了克服过度配合，我试图在我的成本函数中使用L2 Regularization。我有一个小混乱我怎么能选择<weights>把成本公式（代码的最后一行）。 ... x = tf.placeholder(tf.float32, shape=[None, img_size, img_size, num_channels], name='x') #

0热度

1回答

如何查找数据集是否可以训练神经网络？

我是一个机器学习的新手，这是第一个真正的ML任务挑战之一。一些实验数据包含512个独立的布尔特征和一个布尔结果。在提供的数据集中有大约1e6个实验实验记录。在经典的XOR示例中，需要4种可能状态中的4种来训练NN。在我的情况下，它只有2^(10-512) = 2^-505接近零。我没有关于数据性质的更多信息，只是这些(512 + 1) * 1e6位。在可用数据上尝试了带有1个隐藏层的NN

0热度

1回答

Tensorflow：在训练时增加重复预测的次数

我有一个多层感知器，每个感知器有5个隐藏层和256个神经元。当我开始训练时，每次训练样本都会得到不同的预测概率，直到时期50，但随后重复预测的次数增加，在时期300，我已经有30％的重复预测，这是没有意义的，因为输入数据是不同的所有训练样本。任何想法是什么导致这种行为？澄清：与“重复预测”，我指的是完全相同的预测概率项目属于A类（这是一个二元分类问题）我有200 4000个训练样本每个和所有

3热度

1回答

如何在培训期间切换tf.train.Optimizers？

我想在一定数量的纪元后从Adam切换到SGD。我该如何顺利完成这项工作，以便将权重/梯度传递给新优化器？

0热度

1回答

遇到错误使用tensorflow.summary

当我学习TensorFlow通过尝试的例子mnist_softmax.py（this is the orignal file），我为了一些修改添加到它使用TensorBoard： tf.global_variables_initializer().run() merged_summary_op = tf.summary.merge_all() summary_writer =