Jul, 2023

针对少样本动作识别的任务特定对齐和多层 transformer

TL;DR本文提出了一种名为 TSA-MLT 的端到端方法,在多层次特征上使用多层 Transformer 并使用任务特定的 TSA 进行处理,然后使用 L2 和 Optimal transport 距离度量进行融合,并以交叉熵损失进行训练以获得时间和语义方面的对齐,实验结果表明,在 HMDB51 和 UCF101 数据集上获得了最先进的结果,在 Kinetics 和 something-2-something V2 数据集基准测试上也有竞争力。