可控文本生成的因果透视

Jan, 2022

A Causal Lens for Controllable Text Generation

Zhiting Hu, Li Erran Li

TL;DR本论文从因果的角度出发，提出了一种由结构性因果模型构建的可控文本生成框架，并将其应用于集中控制性文本生成领域的实践，实验表明该方法在控制准确性和减少偏差方面具有优势。

Abstract

controllable text generation concerns two fundamental tasks of wide applications, namely generating text of given attributes (i.e., attribute-conditional generation), and minimally editing existing text to posses

controllable text generation attribute-conditional generation text attribute transfer causal inference generation biases

发现论文，激发创造

控制生成文本的发展

本文旨在通过学习简化的语义分离潜在表示来生成和控制自然语言句子，同时通过变分自编码器和全局属性判别器的组合来建立新的神经生成模型。该模型具有可解释性和高效性，可以生成符合要求的具有各种属性的句子。量化评估验证了该模型的生成准确性。

Mar, 2017

具有属性控制的内容保留文本生成

通过该研究，我们提出了一种能够修改文本内容以满足先决条件要求的模型，其通过建立重建和生成关系实现条件兼容和多属性控制。经过定量、定性和人类评估的验证，证明该模型与以往的方法相比，其生成了更加符合先决条件的流畅的句子。

Nov, 2018

个性化文本生成与细粒度语言控制

对于控制细粒度属性的文本生成研究，本文通过引入新的基准测试，系统调查了不同大型语言模型在生成个性化文本方面的性能，并从影响性能的因素中获得了一些见解。

Feb, 2024

面向开放域创造力和公平性的可控文本生成

本文介绍了一些控制文本生成的方法以增强语言生成模型的创造力和公平性，包括层级生成和约束解码，并应用于故事、诗歌、比喻语言的创意生成，以及减少生成模型的社会偏见。

Sep, 2022

受控文本生成的不变特征学习表征

本文探讨了在生成文本中使用分类器控制文本的生成过程中，生成的文本分布与分类器训练集不一致所导致的问题，并提出了一种基于不变性学习的解决方案和选择自然环境的启发式策略。通过实验，本文证明了分布转换对于生成文本的困难性以及不变性方法在解决这个问题上的潜力。

May, 2023

多角度可控文本生成的分布式视角

通过分布式的角度提供属性融合的观察，建议直接搜索作为它们的生成组合的多个属性分布的交集区域。用自编码器结构估计属性空间，通过共同最小化到表示不同属性的点的距离来迭代地接近交集，最后用基于前缀调整的解码器将其映射到与属性相关的句子中。

Oct, 2022

探索可控文本生成技术

本文研究神经可控文本生成的新架构和技术，将其生成过程分为五个模块，分析不同技术的优缺点，为基于这些模块组合的新架构铺平道路。

May, 2020

多方面可控文本生成与解耦式反事实增强

提出了一种新的多方面可控文本生成方法 MAGIC，通过解耦反事实特征向量（在属性潜在空间中）缓解了训练过程中不平衡属性相关性的问题，并通过目标导向的反事实增强在推理过程中增强了属性相关性，实验证明 MAGIC 在不平衡和平衡属性相关性的场景中优于现有的方法。

May, 2024

控制、生成、增强：面向多属性文本生成的可扩展框架

引入了 CGA，一种有条件的 VAE 架构，可用于控制、生成和增强文本，通过对抗学习与上下文感知损失和循环词随机删减程序相结合，能够控制多种语义和句法属性生成自然的英文句子。通过自动和人工评估，证明所生成句子的高质量、多样性和属性控制，用于数据增强的下游 NLP 任务中，相比于强基线和同等数量的真实数据，使用 CGA 模型生成的句子有显著提高，分类性能也有所提升。

Apr, 2020

智能人工代理数据增强的可控文本生成

通过文本生成技术，使用编码器 - 解码器生成模型来增加受训人工智能代理的训练数据，从而实现更快地开发新功能。该方法需要直接优化，适用于有限的数据，并明显优于以往的受控文本生成技术。此外，生成的数据用作外在意图分类任务的附加训练样本，增强了低资源情况下高达 5％绝对 f-score 性能的表现，证实了该方法的实用性。

Oct, 2019