学习运动相位表示的论据
研究了一种学习欧拉运动表示的新方法,该方法使用复杂可转导滤波器来设计相位信息提取模块,以提高 UCF101 数据集上的动作识别性能,并将其与基于光流的现有运动表示进行比较。
Sep, 2018
提出了一个以变换的群属性为基础的运动模型,使用它训练了一个图像运动的表示方法。使用此方法训练的深度神经网络对合成的 2D 序列和真实世界的车辆运动序列都捕捉到了运动特征;在车辆运动的背景下,此方法提取了用于定位、跟踪和测距的信息。这一表示方法在很难获取明确标签的情况下学习运动非常有用。
Dec, 2016
本文介绍了一种全自动方法来将一张静态图像转换为具有连续流体运动的逼真动画循环视频。该方法依赖于单变量特征场的欧拉运动描述,并使用图像到图像的翻译网络来编码自然场景的运动先验,并通过深度扭曲技术,使用产生的运动来动画化图像,从而实现连续流畅的循环视频纹理。
Nov, 2020
本研究提出了一种新颖的自监督学习方法来学习对于动态运动变化有响应的视频表征,通过训练神经网络来区分不同的时间变换的视频序列,使得无需人工标注数据即可准确地识别视频中的不稳定运动并增强神经网络在小数据集上的训练。该方法经过实验证明,可显著提高 UCF101 和 HMDB51 上的动作识别的传递性能。
Jul, 2020
利用几何约束将光流和相机运动估计问题融合为一个双层优化问题,进一步优化了基于无监督深度学习框架的光流估计和相机运动估计的质量,相较于其他无监督学习方法,获得了更好的结果。
Feb, 2020
本文旨在介绍一种最先进的视频表示方法并将其应用于高效的动作识别和检测。我们采用密集轨迹特征提取等一系列方法来改进该方法,并比较了传统基于单词包直方图的编码方法以及 Fisher 向量编码方法在视频识别任务中的表现。实验结果表明,我们提出的改进轨迹特征显着优于传统的密集轨迹方法,并且 Fisher 向量编码方法表现更好。
Apr, 2015
基于光流和动作识别,本文研究不同类型的光流及从光流中提取的特征,通过对光流动态进行功率归一化以纠正流动态并提高性能,进一步将修正后的流动态集成到流行模型中,并通过简单的幻觉步骤翻译 CNN 特征图到不同尺度的光流特征,取得多个基准测试中的最佳性能。
Oct, 2023
本文提出一种基于无监督学习的预测 - 校正方案,通过 PDE 约束的光学流预测器给出速度场的估计,并通过基于物理的校正器进行精细化处理,取得了比光学流方法更好的效果,在基准数据集上表现出与现有监督学习方法具有竞争力的结果。
Jun, 2022
本文介绍了一种新的视频帧插值方法 ——PhaseNet。相较于传统方法和基于深度学习方法,PhaseNet 可以更好地处理光照变化和运动模糊等挑战性场景,并且也适用于更大范围的运动,通过直接估计中间帧的相位分解,避免了使用手工设计启发式方法的缺点。
Apr, 2018
本研究提出一种基于深度学习的方法,通过编码器将每个组件表示为潜在编码,使用神经 ODE 对初始状态进行更新,使用解码器将形状编码和更新状态编码组合在一起重构 3D 模型,并通过身份交换训练策略来有效地解耦每个组件,从而在 4D 重建及运动转移任务中取得了显著改进。
Mar, 2021