Nov, 2023

DEVIAS: 为整体视频理解学习动作和场景的脱缰视频表示

TL;DR通过 Disentangled VIdeo representations of Action and Scene (DEVIAS) 提出了一种细分行动和场景表示的方法,利用 slot attention 和辅助任务来有效提高视频理解性能。