CVPRMar, 2020
展示、编辑、描述:一种编辑图像标题的框架
Show, Edit and Tell: A Framework for Editing Image Captions
Fawaz Sammani, Luke Melas-Kyriazi
TL;DR本文提出了一种基于迭代自适应改进现有标题的图像字幕生成的新方法,该方法包括两个子模块:一个具有自适应复制机制和选择性复制存储器注意机制的语言模块 EditNet 和一个基于 LSTM 的去噪自编码器 DCNet,实验表明我们的方法在 MS COCO 数据集上取得了最先进的性能。