Nov, 2023

GeoDeformer:基于几何变形的动作识别变压器

TL;DR本文提出了一种新的方法 GeoDeformer,它将几何理解直接集成到 ViT 架构中,用于捕捉动作视频中固有的几何变异,实验证明该方法在 UCF101、HMDB51 和 Mini-K200 数据集上取得了显著的准确度提升,并且能够有效表现几何变形及最小化几何变异。