Sep, 2020

另一侧的发现:一种适应视角的匹配编码器用于变化字幕

TL;DR本文提出一种新颖的视觉编码器,以在 Change Captioning 任务中明确区分视点变化和语义变化,并进一步模拟人类的注意力偏好,通过一种新的强化学习过程直接微调注意力。实验结果表明,该方法在 Spot-the-Diff 和 CLEVR-Change 数据集中的表现优于现有方法。