Apr, 2024

ASTRA:一种用于足球视频的动作检测 Transformer

TL;DR在这篇论文中,我们介绍了 ASTRA,这是一个基于 Transformer 的模型,专门用于足球比赛中的动作识别任务。ASTRA 解决了该任务和数据集中的几个困难,包括对精确动作定位的要求,长尾数据分布的存在,某些动作的不可见性和固有的标签噪声。通过使用 Transformer 编码器解码器架构来实现所需的输出时间分辨率和产生精确预测,平衡的混合策略来处理数据的长尾分布,不确定性感知的位移头来捕获标签的可变性,以及输入音频信号来增强对不可见动作的检测,ASTRA 的有效性得到了验证,在测试集上取得了 66.82 的紧密平均 mAP。此外,在 SoccerNet 2023 动作识别挑战中,我们以 70.21 的平均 mAP 获得了第三名的位置。