Sep, 2017

卷积长短时记忆网络用于识别第一人称交互

TL;DR本研究提出了一种基于深度学习的新方法,用于解决从第一人称视角识别互动的问题,其通过一对卷积神经网络提取视频连续帧的特征,然后使用卷积长短时记忆将这些特征进行聚合,最后采用分类算法对记录下的镜头进行分类识别。