Dec, 2021
MAGIC: 多模态关系图对抗推理,用于不同和不配对的基于文本的图像标题
MAGIC: Multimodal relAtional Graph adversarIal inferenCe for Diverse and
Unpaired Text-based Image Captioning
TL;DR研究了如何利用 unpaired training paradigm 生成多样化的文字图像描述,提出了 Multimodal relAtional Graph adversarIal inferenCe (MAGIC) 框架,并使用一种级联生成对抗网络从 multimodal graphs 中推断出相关联的多样化图像描述。