AAAIJan, 2024

STAIR: 空间 - 时序推理中间结果可审计的视频问答方法

TL;DR提出了 STAIR,一个用于视频问答的具有可审计中间结果的时空推理模型。STAIR 是一个神经模块网络,包含一个程序生成器和一组轻量级神经模块,用于完成视频问答的基本子任务,并引入了中间监督来提高准确性。