加速度图像下的运动表示
本文提出了一种基于深度学习的直接运动估计方法,在缺乏大规模数据集的情况下,采用无监督学习的方式训练网络,使用光流约束作为优化代价函数,通过反向传播算法进行误差传递以优化网络,实验证明该方法在合成图像与实际图像序列中的表现都接近于当今最先进的方法。
Jan, 2016
本文提出了一种卷积神经网络用于从视频中提取密集的光流,旨在为深度架构构建潜在的模块,以允许在视频中使用运动而无需借助外部算法,通过考虑信号处理原则构建网络结构,强制“旋转不变性”,并提供一种分布式表示运动的方法。
Jan, 2016
通过用运动矢量直接代替计算光流来加速双流架构,然后通过初始化转移、监督转移和它们的组合,将光流CNN中学习的知识转移到运动矢量CNN中,以提高后者的性能。实验结果表明,该方法的识别性能可与最先进的方法相媲美,同时处理速度比原始的双流方法快27倍。
Apr, 2016
本文提出了一种名为连续深层轨迹描述符(sDTD)的长期运动描述符,它通过将稠密轨迹投影到二维平面上,再使用CNN-RNN网络来学习长期运动的有效表示,进而将sDTD流引入三流框架以从视频序列中识别动作。实验证明该方法在KTH和UCF101数据集上取得了最先进的性能,且在HMDB51数据集上与最先进的方法相媲美。
Sep, 2016
本文提出了一种新的卷积神经网络结构,名为隐式双流卷积神经网络。它可以以端到端的方式处理视频帧并预测动作类别,而不需要显式计算光流,因此速度快于传统方法。实验证明,该方法在四个具有挑战性的动作识别数据集中表现显著优于上一个最佳的实时方法。
Apr, 2017
本文提出了一种基于神经网络的视频分割方法,用于区分视频帧中独立运动的物体,并利用对象运动、外观和时间一致性等多个信息源,通过对数据进行训练得到模型,经过评估表明该模型在DAVIS、Freiburg-Berkeley运动分割数据集和SegTrack等数据集上表现良好。
Dec, 2017
基于卷积神经网络和编码器-解码器结构,提出了一种新颖的人体运动建模方法,并在Human3.6M和CMU Motion Capture数据集上取得了更准确的预测结果。
May, 2018
本研究解决了轨迹分类和回归中的信息损失及其他未充分研究的伪影问题。通过使用不同模态渲染为图像的合成轨迹,探讨了卷积神经网络的有效性,发现适当的图像分辨率与运动历史选择对模型表现至关重要,尤其在运动方向关键的应用中。
Sep, 2024