MMOct, 2020

面向目标导向视觉对话的答案驱动视觉状态估计器

TL;DR本文提出了一种基于答案驱动的视觉状态估计器,用于目标视觉内容的更新和问题生成,并在 GuessWhat?! 数据集上完成了问题生成和猜测任务,获得了最先进的表现。