May, 2023

多层上下文数据生成的纯文本图像标注

TL;DR本文提出了一种新的多情景数据生成框架用于提高文本图像注释的训练数据,该框架使用扩散模型生成复杂和简单图像,并在 MSCOCO、Flickr30k 和 SS1M 等数据集上实现了最先进的表现。