tensorflow

    0热度

    1回答

    我们已经培训了一个tf-seq2seq模型来回答问题。主要框架是google/seq2seq。我们使用双向RNN(GRU编码器/解码器128单元),增加了软关注机制。 我们将最大长度限制为100个字。它大多只产生10〜20个单词。 对于模型的推断,我们尝试两种情况: 正常(贪心算法)。其推断时间约为40ms〜100ms 光束搜索。我们尝试使用波束宽度5,其推断时间约为400ms〜1000ms。 所

    2热度

    2回答

    我经常看到大写和小写单个字符变量。我不确定是否选择了案例,因为变量是一个类的实例,float32,或者只是个人偏好。 以下是Tensorflow入门指南的示例。 https://www.tensorflow.org/get_started/get_started W = tf.Variable([.3], dtype=tf.float32) b = tf.Variable([-.3], dtyp

    1热度

    1回答

    self.logits = nn_layers.full_connect_(self.wide_deep_embed, config.num_classes, activation='None', use_bn = True, \ keep_prob=self.keep_prob, name='output_layer') # predict prob ## loss

    0热度

    1回答

    我试图端口this模型为Keras V2,但我有以下功能相关的问题: def __call__(self, sent1, sent2): def _outer(AB): att_ji = K.batch_dot(AB[1], K.permute_dimensions(AB[0], (0, 2, 1))) return K.permute_dimensions

    0热度

    1回答

    我建立了一个使用conv3d的张量流模型,冻结它并为推理进行了优化。当我把在Android上的推理(TensorflowInferenceInterface.run),我收到以下错误: java.lang.IllegalArgumentException: No OpKernel was registered to support Op 'Conv3D' with these attrs. Re

    1热度

    1回答

    我已经实现了CNN数字分类模型。我的模型过度配合,为了克服过度配合,我试图在我的成本函数中使用L2 Regularization。我有一个小混乱 我怎么能选择<weights>把成本公式(代码的最后一行)。 ... x = tf.placeholder(tf.float32, shape=[None, img_size, img_size, num_channels], name='x') #

    0热度

    1回答

    我是一个机器学习的新手,这是第一个真正的ML任务挑战之一。 一些实验数据包含512个独立的布尔特征和一个布尔结果。 在提供的数据集中有大约1e6个实验实验记录。 在经典的XOR示例中,需要4种可能状态中的4种来训练NN。在我的情况下,它只有2^(10-512) = 2^-505接近零。 我没有关于数据性质的更多信息,只是这些(512 + 1) * 1e6位。 在可用数据上尝试了带有1个隐藏层的NN

    0热度

    1回答

    我有一个多层感知器,每个感知器有5个隐藏层和256个神经元。当我开始训练时,每次训练样本都会得到不同的预测概率,直到时期50,但随后重复预测的次数增加,在时期300,我已经有30%的重复预测,这是没有意义的,因为输入数据是不同的所有训练样本。任何想法是什么导致这种行为? 澄清: 与“重复预测”,我指的是完全相同的预测概率项目属于A类(这是一个二元分类问题) 我有200 4000个训练样本每个和所有

    3热度

    1回答

    我想在一定数量的纪元后从Adam切换到SGD。我该如何顺利完成这项工作,以便将权重/梯度传递给新优化器?

    0热度

    1回答

    当我学习TensorFlow通过尝试的例子mnist_softmax.py(this is the orignal file),我为了一些修改添加到它使用TensorBoard: tf.global_variables_initializer().run() merged_summary_op = tf.summary.merge_all() summary_writer =