MMAug, 2019

无配对跨语言图像字幕生成和自监督奖励

TL;DR本文介绍一种利用增强学习的自监督奖励和多级视觉语义匹配模型来生成跨语言图像描述的方法,在英语和汉语两种语言测试中分别取得了显著的性能提升。