Sep, 2020
另一侧的发现:一种适应视角的匹配编码器用于变化字幕
Finding It at Another Side: A Viewpoint-Adapted Matching Encoder for Change Captioning
Xiangxi Shi, Xu Yang, Jiuxiang Gu, Shafiq Joty, Jianfei Cai
TL;DR本文提出一种新颖的视觉编码器,以在 Change Captioning 任务中明确区分视点变化和语义变化,并进一步模拟人类的注意力偏好,通过一种新的强化学习过程直接微调注意力。实验结果表明,该方法在 Spot-the-Diff 和 CLEVR-Change 数据集中的表现优于现有方法。