本文旨在通过学习简化的语义分离潜在表示来生成和控制自然语言句子,同时通过变分自编码器和全局属性判别器的组合来建立新的神经生成模型。该模型具有可解释性和高效性,可以生成符合要求的具有各种属性的句子。量化评估验证了该模型的生成准确性。
Mar, 2017
通过该研究,我们提出了一种能够修改文本内容以满足先决条件要求的模型,其通过建立重建和生成关系实现条件兼容和多属性控制。经过定量、定性和人类评估的验证,证明该模型与以往的方法相比,其生成了更加符合先决条件的流畅的句子。
Nov, 2018
对于控制细粒度属性的文本生成研究,本文通过引入新的基准测试,系统调查了不同大型语言模型在生成个性化文本方面的性能,并从影响性能的因素中获得了一些见解。
Feb, 2024
本文介绍了一些控制文本生成的方法以增强语言生成模型的创造力和公平性,包括层级生成和约束解码,并应用于故事、诗歌、比喻语言的创意生成,以及减少生成模型的社会偏见。
Sep, 2022
本文探讨了在生成文本中使用分类器控制文本的生成过程中,生成的文本分布与分类器训练集不一致所导致的问题,并提出了一种基于不变性学习的解决方案和选择自然环境的启发式策略。通过实验,本文证明了分布转换对于生成文本的困难性以及不变性方法在解决这个问题上的潜力。
May, 2023
通过分布式的角度提供属性融合的观察,建议直接搜索作为它们的生成组合的多个属性分布的交集区域。用自编码器结构估计属性空间,通过共同最小化到表示不同属性的点的距离来迭代地接近交集,最后用基于前缀调整的解码器将其映射到与属性相关的句子中。
Oct, 2022
本文研究神经可控文本生成的新架构和技术,将其生成过程分为五个模块,分析不同技术的优缺点,为基于这些模块组合的新架构铺平道路。
May, 2020
提出了一种新的多方面可控文本生成方法 MAGIC,通过解耦反事实特征向量(在属性潜在空间中)缓解了训练过程中不平衡属性相关性的问题,并通过目标导向的反事实增强在推理过程中增强了属性相关性,实验证明 MAGIC 在不平衡和平衡属性相关性的场景中优于现有的方法。
May, 2024
引入了 CGA,一种有条件的 VAE 架构,可用于控制、生成和增强文本,通过对抗学习与上下文感知损失和循环词随机删减程序相结合,能够控制多种语义和句法属性生成自然的英文句子。通过自动和人工评估,证明所生成句子的高质量、多样性和属性控制,用于数据增强的下游 NLP 任务中,相比于强基线和同等数量的真实数据,使用 CGA 模型生成的句子有显著提高,分类性能也有所提升。
Apr, 2020
通过文本生成技术,使用编码器 - 解码器生成模型来增加受训人工智能代理的训练数据,从而实现更快地开发新功能。该方法需要直接优化,适用于有限的数据,并明显优于以往的受控文本生成技术。此外,生成的数据用作外在意图分类任务的附加训练样本,增强了低资源情况下高达 5%绝对 f-score 性能的表现,证实了该方法的实用性。
Oct, 2019