STAF：视频中基于时空对齐融合的三维人体网格恢复

Jan, 2024

STAF：视频中基于时空对齐融合的三维人体网格恢复

STAF: 3D Human Mesh Recovery from Video with Spatio-Temporal Alignment Fusion

Wei Yao, Hongwen Zhang, Yunlian Sun, Jinhui Tang

TL;DR提出了一种基于视频的 Spatio-Temporal Alignment Fusion (STAF) 模型，通过关注基于注意力的 Temporal Coherence Fusion Module (TCFM) 中的人体运动的相干线索，以及通过在特征图上预测网格投影来提取细粒度局部信息的 Spatial Alignment Fusion Module (SAFM)，进一步引入多阶段邻近空间对齐融合模块以增强目标帧的特征表示，同时使用 Average Pooling Module (APM) 提高对整个输入序列的关注，从而显著提高了从视频中恢复结果的平滑度。通过在 3DPW、MPII3D 和 H36M 上进行了大量实验证明了 STAF 的优越性，实现了在精度和平滑度之间的最新权衡。

Abstract

The recovery of 3d human mesh from monocular images has significantly been developed in recent years. However, existing models usually ignore spatial and temporal information, which might lead to mesh and image m

3d human mesh monocular images spatial and temporal information spatio-temporal alignment fusion (staf) model video-based model

发现论文，激发创造

使用循环时空亲和场实现高效的多人二维姿态跟踪

本文提出了一种在线方法，可以有效地同时检测和跟踪视频序列中多个人的 2D 姿态，使用基于 PAF 表示的 STAF 编码和预测跨越视频序列的时间和空间亲和力场，使用递归神经网络使总体方法递归化，并且只使用在线推断和跟踪，不随场景中人数的运行时不变性和输入帧率的准确性不变性，使单 GPU 上的运行速度为约 30fps，在 PoseTrack 基准测试中取得了极具竞争力的结果。

Nov, 2018

STF：时空融合模块提升视频目标检测

通过利用视频中连续帧的冗余和相关的互补信息，我们提出了一个时空融合框架，其中包括多帧和单帧关注模块，以及可学习地合并特征图以改进物体检测性能的双帧融合模块。实验证明，该融合模块相比基线物体检测器能够提高检测性能。

Feb, 2024

STF：空间时间融合的轨迹预测

本研究提出了一种集成的三维图形方法，将空间和时间信息融合在一起，并考虑跨时间的交互信息，以更准确地预测车辆轨迹。实验证明，该方法在长时间范围的轨迹预测中表现优于其他基线方法。

Nov, 2023

递归融合与可变形时空注意力在视频压缩伪影减少中的应用

本文提出了一种基于深度学习的视频还原方法，其采用递归融合模块和可变形时空注意力模块进行补偿，从而提高了众多现有算法在 MFQE 2.0 数据集上的还原质量。

Aug, 2021

通过时空对齐和聚合的深度视频抠图

本文介绍了一个深度学习的视频抠图框架，使用了一种新颖和有效的时空特征聚合模块 (ST-FAM)，同时引入了一种轻量级的交互式 trimap 传播网络，配合一个大规模的视频抠图数据集进行评估，实验结果表明，该框架在具有多帧时间信息的视频中，在定量和定性实验中均显著优于传统视频抠图和应用于视频的深度图像抠图方法。

Apr, 2021

从视频获取时间上连贯的 3D 人体姿态和形状的非静态特征研究

该研究提出了一种基于视频的 3D 人体运动重建系统，该系统有效聚焦于过去和未来帧的时间信息，从而更好地解决了单张图像方法的时间不一致性问题。通过在帧间进行时间一致性的处理，该系统达到了更好的运动姿态和形状精度。

Nov, 2020

时空对齐网络用于动作识别

通过引入视点不变特征表示，研究提高现有动作识别架构；提出了一种轻量级通用的空间 - 时间对齐网络（STAN）用于学习动作识别的几何不变表示；实验证明 STAN 模型在广泛使用的数据集上能够在从头开始训练的模式下持续改进动作识别任务的最先进模型。

Aug, 2023

基于时间感知的视频人体姿态与形状恢复的改进

通过提出一个 Temporal-Aware Refining Network (TAR)，本文探索了对于精确的姿势和形状恢复而言的全局和局部图像特征的时间感知，实现了比现有方法更准确的结果。

Nov, 2023

增强时空上下文：单目视频中具有时态一致性的稳健 3D 人体动作恢复

提出了一种从单眼视频中恢复时间一致的 3D 人体姿势、形状和动作的方法，通过使用具有身体感知特征表示和独立的逐帧姿势和相机初始化，结合自相似性和自注意力等技术进行时空特征聚合，该方法提供了增强的时空上下文，可在各种复杂场景下得到更准确的姿势估计和形状重建。

Nov, 2023

STA: 大规模视频人员再识别的时空注意力

本文中，我们提出了一种新的空间 - 时间注意力（STA）方法，用于解决视频中的大规模人员重新识别任务，该方法通过在时空维度上充分利用那些具有区分性的目标人物部分来生成鲁棒的剪辑级特征表示，使用该方法可以很好地解决基于视频的人员重新识别的挑战性问题，如姿势变化和部分遮挡。

Nov, 2018