2017-02-23 34 views
0
基于此教程

https://medium.com/@harvitronix/continuous-online-video-classification-with-tensorflow-inception-and-a-raspberry-pi-785c8b1e13e1#.n7mlkeevlCNN的行为分类

他们只是通过合并CNN和RNN进行视频分类,足球比赛区分在电视上的广告构成的CRNN网络。

我的问题是分类或简单地决定这个输入视频是否包含作弊行为(考试作弊),因此根据本教程,我应该通过一组作弊和非作弊图像来训练CNN,然后我会通过这个网络传递一系列帧,输出一系列(作弊者/非作弊者)标志,最后用该输出训练或测试RNN。

因此,CNN在这种情况下表现会很好,因为我会利用我自己和我的团队充当骗子和非作弊者来获取大型数据集来训练CNN,这意味着同一个人将扮演骗子和非骗子,这可能会导致混乱!

我最后的问题是我可以使用教程中声明的方法进行行为分类吗? ..或者CNN能否成功地区分作弊和非作弊帧?

回答

0

其实,使用同样的人作为骗子和非骗子的剪辑会提高的训练。神经网络将不得不学会通过动作来区分,而不是骗子的物理特征。

我希望这对你来说能够很好地工作。但是,根据具体行为,您可能需要使用视频序列而不是单个帧来描述某些行为。有时,作弊包括一系列请求和响应,而不是包含在单个帧中的数据。

这有帮助吗?

+0

我们的方法是将每帧产生的CNN结果(聚集成一个作弊和非作弊标志的向量)作为序列分类器传递给RNN ..本教程中解释了相同的方法。 但是,如果你不介意,你能否为我提供一些视频序列分类技术? –

+0

这超出了堆栈溢出的范围。请阅读并遵守帮助文档中的发布准则。 [在主题](http://stackoverflow.com/help/on-topic)和[如何提问](http://stackoverflow.com/help/how-to-ask)适用于此处。 – Prune