多方面可控文本生成与解耦式反事实增强

ACLMay, 2024

多方面可控文本生成与解耦式反事实增强

Multi-Aspect Controllable Text Generation with Disentangled Counterfactual Augmentation

Yi Liu, Xiangyu Liu, Xiangrong Zhu, Wei Hu

TL;DR提出了一种新的多方面可控文本生成方法 MAGIC，通过解耦反事实特征向量（在属性潜在空间中）缓解了训练过程中不平衡属性相关性的问题，并通过目标导向的反事实增强在推理过程中增强了属性相关性，实验证明 MAGIC 在不平衡和平衡属性相关性的场景中优于现有的方法。

Abstract

multi-aspect controllable text generation aims to control the generated texts in attributes from multiple aspects (e.g., "positive" from sentiment and "sport" from topic). For ease of obtaining training samples, existing works neglect →

multi-aspect controllable text generation attribute correlations disentangled counterfactual augmentation imbalanced attribute correlations target-guided counterfactual augmentation

发现论文，激发创造

多角度可控文本生成的分布式视角

通过分布式的角度提供属性融合的观察，建议直接搜索作为它们的生成组合的多个属性分布的交集区域。用自编码器结构估计属性空间，通过共同最小化到表示不同属性的点的距离来迭代地接近交集，最后用基于前缀调整的解码器将其映射到与属性相关的句子中。

Oct, 2022

控制、生成、增强：面向多属性文本生成的可扩展框架

引入了 CGA，一种有条件的 VAE 架构，可用于控制、生成和增强文本，通过对抗学习与上下文感知损失和循环词随机删减程序相结合，能够控制多种语义和句法属性生成自然的英文句子。通过自动和人工评估，证明所生成句子的高质量、多样性和属性控制，用于数据增强的下游 NLP 任务中，相比于强基线和同等数量的真实数据，使用 CGA 模型生成的句子有显著提高，分类性能也有所提升。

Apr, 2020

通过闭环解缠实现文本属性控制

利用半监督对比学习方法，我们提出一种新的方法来实现属性的稳健控制，并增强内容的保留。通过重新解缠重构的句子并将其与原始潜变空间进行比较，我们实现了一个闭环解缠过程，进一步帮助内容保留。与以往方法不同，对比学习方法能够代替最小化互信息和对抗训练在解缠过程中的作用，从而减少计算成本。我们在三个文本数据集上进行了实验证明了我们模型的有效性。

Dec, 2023

控制生成文本的发展

本文旨在通过学习简化的语义分离潜在表示来生成和控制自然语言句子，同时通过变分自编码器和全局属性判别器的组合来建立新的神经生成模型。该模型具有可解释性和高效性，可以生成符合要求的具有各种属性的句子。量化评估验证了该模型的生成准确性。

Mar, 2017

可控文本生成的因果透视

本论文从因果的角度出发，提出了一种由结构性因果模型构建的可控文本生成框架，并将其应用于集中控制性文本生成领域的实践，实验表明该方法在控制准确性和减少偏差方面具有优势。

Jan, 2022

属性对齐：控制预训练语言模型的文本生成

提出一种简单而灵活的方法，通过对齐分离的属性表示，控制文本生成，用于控制情感极性或特定主题的目标属性。与之前的方法不同，我们使用相同的数据学习对齐函数，而不是通过训练鉴别器来扰动属性的令牌级分布。我们在情感极性和主题控制生成上评估了我们的方法，并表现出大幅度的性能提升，同时保持流畅性和多样性。

Mar, 2021

通过编辑纠缠隐式表示实现可控非监督文本属性转移

我们提出了一种基于 Transformer 自编码器和快速梯度迭代修改算法的非监督文本属性转移框架，可在不使用任何平行数据的情况下更改特定属性，同时保留其属性独立内容，并且能够灵活控制转移程度和同时转移多个方面。

May, 2019

多方面控制的文本生成的组合性泛化能力基准测试与提升

CompMCTG 是一个综合多方面标记数据集和三维评估协议的评估基准，用于评估 MCTG 方法的组合泛化能力，而 Meta-MCTG 是一种训练框架，通过在训练阶段模拟组合泛化场景，使模型能够学习如何泛化，并在 94.4% 的情况下在组合测试性能方面明显改善（最多提高 3.64%）。

Apr, 2024

柔性文本生成用于反事实公平探究

本文介绍了一种使用大型语言模型生成对抗样本的方法，该方法克服了现有方法的局限性，能够产生复杂的对抗样本，并在 Civil Comments 数据集上比较了各种方法的性能和价值，并展示了其在评估毒性分类器方面的价值。

Jun, 2022

具有属性控制的内容保留文本生成

通过该研究，我们提出了一种能够修改文本内容以满足先决条件要求的模型，其通过建立重建和生成关系实现条件兼容和多属性控制。经过定量、定性和人类评估的验证，证明该模型与以往的方法相比，其生成了更加符合先决条件的流畅的句子。

Nov, 2018