May, 2022

使用密集检测锚点在足球视频中精确检测动作

TL;DR通过使用一组密集的检测锚点,预测每个锚点的检测置信度和相应的精细时间位移量,我们提出了一种视频中时间精准行动检测的模型,并尝试了两种主干架构,一维版的 u-net 和 Transformer 编码器 (TE), 并采用锐度感知最小化 (SAM) 和混合数据增强方法进行模型训练,取得了 SoccerNet-v2 数据集上的最新最佳性能,同时证明了预测时间位移量,不同主干架构的权衡,采用 SAM 和 mixup 进行训练的好处等相关实验结果。