spatial-temporal transformer network | BriefGPT

关键词spatial-temporal transformer network

搜索结果 - 4

MM少即是多：遮盖帧建模实现一致的视频深度估计
通过邻近帧预测掩蔽帧的深度，使用 FMNet 可以学习内在的帧间相关性，从而实现时间上的一致性，具有与之前方法相当的空间准确性和更高的时间一致性。
PDF2 years ago
基于骨骼的动作识别的时空转换器网络
本文提出了一种新的空时变换器网络（ST-TR），该网络利用 Transformer 自我注意机制对 3D 骨架中的关节之间的依赖关系进行建模。空间自我注意模块（SSA）用于理解不同身体部位之间的帧内相互作用，而时间自我注意模块（TSA）用于
PDF4 years ago
基于空间和时间变换器网络的基于骨架的动作识别
本文提出了一种基于 Spatial-Temporal Transformer 网络的骨骼姿态行为识别方法，使用自注意力机制成功提取了骨骼运动及其相关性的信息，与其他同类算法相比在多个大规模数据集上表现出更好的精度。
PDF4 years ago
ECCV学习视频修复的联合时空变换
本篇论文提出了一种基于自注意力机制和空间 - 时间转换网络的视频修复方法，通过对所有输入帧进行自注意力填充缺失区域，并提出利用空间 - 时间对抗损失进行优化的方法，从而在定量和定性方面证明了该模型的优越性。
PDF4 years ago