ECCVAug, 2018

多跳特征调节视觉推理

TL;DR本文提出了在卷积神经网络中多次迭代地生成 Feature-wise Linear Modulation(FiLM)层参数的方法,以更好地处理诸如对话等较长的输入序列,并在 GuessWhat?!视觉对话任务中显著优于之前的最新技术和单次 FiLM 生成。