关键词spatial-temporal transformer network
搜索结果 - 4
- MM少即是多:遮盖帧建模实现一致的视频深度估计
通过邻近帧预测掩蔽帧的深度,使用 FMNet 可以学习内在的帧间相关性,从而实现时间上的一致性,具有与之前方法相当的空间准确性和更高的时间一致性。
- 基于骨骼的动作识别的时空转换器网络
本文提出了一种新的空时变换器网络(ST-TR),该网络利用 Transformer 自我注意机制对 3D 骨架中的关节之间的依赖关系进行建模。空间自我注意模块(SSA)用于理解不同身体部位之间的帧内相互作用,而时间自我注意模块(TSA)用于 - 基于空间和时间变换器网络的基于骨架的动作识别
本文提出了一种基于 Spatial-Temporal Transformer 网络的骨骼姿态行为识别方法,使用自注意力机制成功提取了骨骼运动及其相关性的信息,与其他同类算法相比在多个大规模数据集上表现出更好的精度。
- ECCV学习视频修复的联合时空变换
本篇论文提出了一种基于自注意力机制和空间 - 时间转换网络的视频修复方法,通过对所有输入帧进行自注意力填充缺失区域,并提出利用空间 - 时间对抗损失进行优化的方法,从而在定量和定性方面证明了该模型的优越性。