TTIDA: 通过文本转文本和文本转图像模型进行可控生成数据增强

Apr, 2023

TTIDA: 通过文本转文本和文本转图像模型进行可控生成数据增强

TTIDA: Controllable Generative Data Augmentation via Text-to-Text and Text-to-Image Models

Yuwei Yin, Jean Kaddour, Xiang Zhang, Yixin Nie, Zhenguang Liu...

TL;DR本文提出了 TTIDA（Text-to-Text-to-Image 数据增强）方法，利用大型预训练的 T2T 和 T2I 生成模型来进行数据增强。通过在 T2T 模型的细节描述下对 T2I 模型进行条件控制，我们能够以灵活和可控的方式生成逼真的标记图像。对于领域内分类、跨领域分类和图像字幕任务的实验表明，与其他数据增强基线相比，TTIDA 表现一致地表现出了优越的性能和增强韧性。分析研究进一步证明了 TTIDA 增强性能和提高鲁棒性的有效性。

Abstract

data augmentation has been established as an efficacious approach to supplement useful information for low-resource datasets. Traditional augmentation techniques such as noise injection and image transformations have been widely used. In addition, generative →

data augmentation generative data augmentation generative adversarial networks text-to-text text-to-image

发现论文，激发创造

目标图像数据增强提高基本技能字幕鲁棒性

通过填补世界相关性结构的缺失，利用文本到图像生成模型改进人类模型在性别识别等方面的能力，显示了一种目标图像编辑数据增强方法在性别、颜色和计数能力方面提高图像字幕度量的性能，并分析了图像字幕模型在视觉编码和文本解码方面的不同行为表现。

Sep, 2023

RenAIssance: 大型模型时代的 AI 文字到图像生成调查

文本到图像生成使用神经网络和扩展模型规模的创新模型架构与预测增强技术相结合的方法，提供了几种不同的方法并对其进行了详细比较和评价，为未来的工作提供了改进的可能路径。

Sep, 2023

可控生成的文本 - 图像扩散模型：一份综述

在控制生成方面与文本到图像扩散模型的研究领域，通过调查文献并总结了控制性生成，包括基本概念和实践研究。

Mar, 2024

智能人工代理数据增强的可控文本生成

通过文本生成技术，使用编码器 - 解码器生成模型来增加受训人工智能代理的训练数据，从而实现更快地开发新功能。该方法需要直接优化，适用于有限的数据，并明显优于以往的受控文本生成技术。此外，生成的数据用作外在意图分类任务的附加训练样本，增强了低资源情况下高达 5％绝对 f-score 性能的表现，证实了该方法的实用性。

Oct, 2019

数据增强已死，数据增强万岁

在这篇论文中，我们挑战了传统数据增强方法的有效性，并表明经过更多时间的微调可以抵消数据增强的效果。我们还展示了零和少量数据生成方法通过对话代理（如 ChatGPT 或 LLama2）可以提高性能，从而总结出这种形式的数据增强仍然有效，即使传统方法不起作用。

Feb, 2024

T2I-Adapter: 学习适配器以挖掘更多可控能力的文本到图像扩散模型

该论文提出了使用轻量级的 T2I 适配器来对图像生成过程进行更加精准的控制，实现在不同条件下的色彩和结构控制，并具有可组合性和广泛的应用前景。

Feb, 2023

文本到图像合成的语义感知数据增强

通过语义感知数据增强 (SADA) 框架来提升文本到图像合成 (T2Isyn) 模型中的文本 - 图像一致性并改善图像质量。该框架通过隐式文本语义保持增强 (ITA) 在语义空间中扩充文本，并结合特定设计的图像语义正则化损失 (Lr) 作为生成图像的语义保持，以解决语义不匹配和坍塌问题。大量实验证实了 SADA 在各种模型中提升了文本 - 图像一致性和图像质量，特别是在 Stable Diffusion 模型调整过程中的改进效果。

Dec, 2023

通过扩散模型的类间图片混合提升图像分类

通过 Diff-Mix 方法进行图像翻译以实现数据增强，实现更好的忠实度和多样性平衡，从而在各种图像分类场景中显著提高性能。

Mar, 2024

DATID-3D: 使用文图扩散保持多样性的 3D 生成模型域适应

DATID-3D 是一种适用于 3D 生成模型的领域适应方法，采用文本到图像扩散模型，在不收集附加数据的情况下，将源领域的最先进 3D 生成器微调为文本引导的目标领域，从而实现高分辨率、多视角一致的图像合成，并提出并演示了多样的 3D 图像操作。

Nov, 2022

通过测试时间增强来改进文本分类

本文提出了一种改进的测试时间增强技术并设计出相应的增强策略，结果表明用于语言模型上的测试时间增强可以显著提高模型的准确性。

Jun, 2022