2
该模型的目标是将视频输入按照与它们关联的词进行分类分类。每个输入具有45个帧,1个灰色通道,100个像素行和150个像素列(45,1,100,150)的维度,而每个相应的输出是3个可能字中的一个的一个热编码表示(例如“是“=> [0,0,1])。Keras ValueError:尺寸必须相同
在模型的编译,出现以下错误:
ValueError: Dimensions must be equal, but are 1 and 3 for 'Conv2D_94' (op: 'Conv2D') with
input shapes: [?,100,150,1], [3,3,3,32].
这是用来训练模型中的脚本:
video = Input(shape=(self.frames_per_sequence,
1,
self.rows,
self.columns))
cnn = InceptionV3(weights="imagenet",
include_top=False)
cnn.trainable = False
encoded_frames = TimeDistributed(cnn)(video)
encoded_vid = LSTM(256)(encoded_frames)
hidden_layer = Dense(output_dim=1024, activation="relu")(encoded_vid)
outputs = Dense(output_dim=class_count, activation="softmax")(hidden_layer)
osr = Model([video], outputs)
optimizer = Nadam(lr=0.002,
beta_1=0.9,
beta_2=0.999,
epsilon=1e-08,
schedule_decay=0.004)
osr.compile(loss="categorical_crossentropy",
optimizer=optimizer,
metrics=["categorical_accuracy"])
@roganjosh请参阅最新的问题。谢谢。 –
@roganjosh你说去掉追踪,所以我做到了。 –
您误解了该评论。我的意思是“发布回溯格式正确,而不是图像”。我想不出有什么情况可以去除追踪包。它不应该是裁剪后的图像。对不起,如果不清楚。 – roganjosh