视频中动作检测的管状卷积神经网络 (T-CNN)
本研究提出了一种用于视频中动作检测和分割的端到端 3D CNN,利用 3D 卷积特征识别和定位动作,通过平分视频为若干部分,生成不同段落的膜状提议,然后把不同段的提议联系在一起,通过上下文信息实现视频物体分割和动作检测。
Nov, 2017
提出了一种深度学习框架 T-CNN,该框架从视频中获取来自 tubelets 的时间和语境信息,用于物体检测,经证实,在 ImageNet Large-Scale Visual Recognition Challenge 2015(ILSVRC2015)的提供数据的物体检测从视频(VID)任务中表现出色。
Apr, 2016
本研究提出了一种由 Deformation Tube Proposal Network(DTPN)和 Deformable Tube Recognition Network(DTRN)组成的 Deformable Tube Network,该网络能够对视频进行空间 - 时间动作检测,并通过建立动作的可变形管来检测动作。实验结果表明,与使用 3D cuboids 的方法相比,Deformable Tube Network 的性能显著提高,并在 UCF-Sports 和 AVA 数据集上获得了最先进的结果。
Jul, 2019
提出了一种统一的时间卷积网络方法,可以逐层捕捉低、中、高层次时间尺度上的关系,在三个公共操作分割数据集上以视频或传感器数据实现了优越或竞争性能,并且可以在较短时间内训练完成。
Aug, 2016
本文提出了一种动作检测方法,使用从 2D 图像中物体检测领域的最新进展,利用形状和运动线索建立动作模型,并通过运动显著性选择图像区域提取时空特征建立强分类器,得出了时间一致的动作检测结果。
Nov, 2014
本文提出通过静态和运动信息的早期和后期融合检测和跟踪点匹配算法实现视频中时空动作检测,并使用递归 3D 卷积神经网络来预测并确定生成的动作分类和时间边界。通过引入动作足迹图以及 R3DCNN 卷积层中保留的特定空间特征来细化候选框,并在三个公共数据集上获得了优越的检测结果:UCFSports、J-HMDB 和 UCF101。
Nov, 2018
本研究提出了名为 VideoCapsuleNet 的 3D 胶囊网络,可以实现动作检测和像素级动作分割,其中胶囊池化被引入作为卷积胶囊层的一部分以优化计算。研究结果表明,在多个动作检测数据集上,该网络在检测精度方面均有显著提升。
May, 2018
本文提出了一种基于深度卷积神经网络的两通道 ConvNet 架构,结合了空间和时间网络,利用稀疏光流信息进行训练并使用多任务学习提高模型性能,成功地提高了视频动作识别的准确率。
Jun, 2014
本论文提出了一种通过将循环神经网络和卷积神经网络相结合运用于动作识别的算法,通过 SVM 对特征进行分类,实验结果表明,在标准数据集上,该算法提高了 14% 的识别率。
Mar, 2017