Apr, 2023

TTIDA: 通过文本转文本和文本转图像模型进行可控生成数据增强

TL;DR本文提出了 TTIDA(Text-to-Text-to-Image 数据增强)方法,利用大型预训练的 T2T 和 T2I 生成模型来进行数据增强。通过在 T2T 模型的细节描述下对 T2I 模型进行条件控制,我们能够以灵活和可控的方式生成逼真的标记图像。对于领域内分类、跨领域分类和图像字幕任务的实验表明,与其他数据增强基线相比,TTIDA 表现一致地表现出了优越的性能和增强韧性。分析研究进一步证明了 TTIDA 增强性能和提高鲁棒性的有效性。