Feb, 2023

使用注意机制的 3D CNNs 基准方法 - MediaEval 2022 体育任务

TL;DR本文介绍了用于媒体评估 2022 排行榜中运动视频任务的基础方法,该任务包括修剪视频的击球分类和未修剪视频的击球检测。我们为解决这两个子任务提出了两种 3D-CNN 架构,它们都使用了时空卷积和注意机制。基于我们的 v2 模型,分类子任务的基线方法达到了 86.4% 的准确度。对于检测子任务,基线方法使用 v1 模型实现了 0.131 的 mAP 和 0.515 的 IoU。该基线方法已公开在线共享,旨在帮助研究人员解决视频处理、训练方法、评估和提交等方面的问题。