Nov, 2020

上下文 - 对象分离潜空间的多样化图像字幕

TL;DR本文介绍了一种基于上下文以及对象的潜在空间拆分方法,用于在跨域数据集中进行多样化的图像描述生成任务,实现了对图像上下文的多样化描述,同时通过将假的描述信息作为网络的监督信号,扩展了该网络使其可以处理新对象并在没有训练数据的情况下进行图像生成。实验结果表明该方法在 COCO 数据集上准确度和多样性表现良好。