双流动作识别导向视频超分辨率
本文提出了一种全耦合的两路时空结构体系框架,可在极低分辨率(如 12x16 像素)视频中可靠地识别人的动作,以保护人们的隐私,同时在训练期间考虑高分辨率视频以建立更好的低分辨率模型,取得了明显的改进。
Jan, 2018
本文提出了一个端到端可训练的视频超分辨率框架,使用 HR 光流可提供更精确的对应关系并提高性能。在 Vid4 和 DAVIS-10 数据集上进行的比较结果显示,我们的框架实现了最先进的表现。
Sep, 2018
本文提出了一种用于视频超分辨率的端到端深度学习网络,其中通过光流重建和图像超分辨率的结合,采用粗到细的方式实现了高分辨率光流的重建和精细细节的恢复,以解决视频 SR 中针对低分辨率光流与高分辨率输出间存在的分辨率矛盾问题,并通过广泛实验证明了其在提高视频 SR 性能方面的有效性及其在 Vid4 和 DAVIS-10 数据集上的最新成果。
Jan, 2020
本文提出了一种基于深度卷积神经网络的两通道 ConvNet 架构,结合了空间和时间网络,利用稀疏光流信息进行训练并使用多任务学习提高模型性能,成功地提高了视频动作识别的准确率。
Jun, 2014
该研究提出了一种新的基于双向交互的有效和高效的时空视频超分辨率方法,并设计了混合融合模块,用于聚合和提炼信息以改进空间信息和重构高质量视频帧,实验表明,我们的方法在效率上优于现有的方法并降低了约 22% 的计算成本。
Jul, 2022
提出了基于姿态的双流关系网络(PSRN)来解决目前基于姿态的动作识别存在的问题,该方法包括两个流,一个流用于建模目标 2D 人体姿势序列的时间动态,另一个流用于建模与动作相关的物体,通过姿态对象关系网络建模了人体姿态和动作相关物体之间的关系,在 Sub-JHMDB 和 PennAction 数据集上取得了最新的性能表现。
May, 2018
本研究采用 Transformer 对视频超分辨率问题进行了改进,引入了空时卷积自注意力层以利用数据位置信息,设计了双向光流驱动前馈层以发现不同视频帧之间的相关性并对齐特征,实验证明了这种方法的有效性。
Jun, 2021
通过引入物理信息的神经网络,本文提出了解决空时视频超分辨率问题的方法,该方法能够准确处理大运动中的运动估计和运动补偿问题,并在固定大小和连续空时视频超分辨率任务中超过同类技术。
Apr, 2024
本文提出了一种用于视频动作识别的两流光流引导卷积注意网络模型,通过正确补偿相机运动,可以用光流来引导关注人类前景,从而防止背景干扰,得到了良好的性能表现。
Aug, 2017