Nov, 2023
DEVIAS: 为整体视频理解学习动作和场景的脱缰视频表示
DEVIAS: Learning Disentangled Video Representations of Action and Scene for Holistic Video Understanding
Kyungho Bae, Geo Ahn, Youngrae Kim, Jinwoo Choi
TL;DR通过 Disentangled VIdeo representations of Action and Scene (DEVIAS) 提出了一种细分行动和场景表示的方法,利用 slot attention 和辅助任务来有效提高视频理解性能。