Nov, 2022

Re^2TAL:针对可逆时间行为定位重构预训练视频主干网络

TL;DR该论文提出了一种基于可逆网络的端到端方法 Re2TAL,用于时间行为定位(TAL),通过网络重连机制,将预训练的视频模型转换为基于可逆模块的模型,以提高模型训练效率和表现。使用此方法,只使用 RGB 模态的 Re2TAL 在 ActivityNet-v1.3 上达到 37.01%的平均 mAP,并在 THUMOS-14 上的 tIoU=0.5 时获得 64.9%的 mAP,表现优于其他 RGB-only 方法。