Dec, 2021

MAGIC: 多模态关系图对抗推理,用于不同和不配对的基于文本的图像标题

TL;DR研究了如何利用 unpaired training paradigm 生成多样化的文字图像描述,提出了 Multimodal relAtional Graph adversarIal inferenCe (MAGIC) 框架,并使用一种级联生成对抗网络从 multimodal graphs 中推断出相关联的多样化图像描述。