NIPSNov, 2016

基于时空残差网络的视频动作识别

TL;DR本文介绍了一种新的结构 spatiotemporal ResNets,将两种架构 two-stream Convolutional Networks 和 Residual Networks 相结合,通过残差连接实现了空时交互,并引入可学习卷积过滤器,将图像 ConvNets 转换成空时网络,从而提高了动作识别的准确率。