ECCVJul, 2020

可控长度的图像描述生成

TL;DR本文提出了一种基于长度级别嵌入的、具备控制图像描述语言能力的、非自回归图像描述模型,实验证明该模型在 MS COCO 数据集上不仅实现了 SOTA 水平,还能够生成长度可控、多样化的图像描述。