通过退化模型学习多样化神经文本生成技术

ACLSep, 2023

通过退化模型学习多样化神经文本生成技术

Learning to Diversify Neural Text Generation via Degenerative Model

Jimin Hong, ChaeHun Park, Jaegul Choo

TL;DR通过训练两个模型来防止神经语言模型生成单一和重复的文本，从而增强多样性和信息量，实验证明这种方法的有效性。

Abstract

neural language models often fail to generate diverse and informative texts, limiting their applicability in real-world problems. While previous approaches have proposed to address these issues by identifying and penalizing undesirable behaviors (e.g., repetition, overuse of frequent w

neural language models diverse texts undesirable behaviors degeneration problems dialogue generation

发现论文，激发创造

神经文本退化的好奇案例

本研究发现人类文本和机器生成文本的分布存在差异，在相同的神经语言模型下使用不同的解码策略可以显著影响文本质量，提出了一种基于动态核心采样的方法来提高生成文本的多样性和流畅性。

Apr, 2019

自然语言生成模型训练中的表示退化问题

本文研究了神经网络训练自然语言生成任务模型时的 “表示退化问题”，提出一种新的正则化方法来解决这个问题，并在语言建模和机器翻译任务上实验验证了其性能优于基准算法。

Jul, 2019

重复输入重复输出：从数据角度理解神经文本退化

我们通过数据角度的初步研究发现，训练数据中重复出现的词语与文本退化问题之间存在强烈的相关性，通过有选择地消除训练数据中重复词语的注意力，可以显著减少退化现象，并且惩罚训练数据中的重复部分是解决退化问题的一个普遍而基本的因素。

Oct, 2023

将神经文本退化与曝光偏差相关联

本文研究神经语言生成领域的两个问题：曝光偏差和文本退化，定量和定性分析了退化发生前的误差并探讨了它们对 GPT-2 文本退化的影响，结果表明这种文本退化有一部分原因是曝光偏差导致的，同时阐述了误差增强的自我强化机制。

Sep, 2021

评估语言模型中神经毒性退化的 RealToxicityPrompts

该研究通过创建 RealToxicityPrompts 数据集，使用多种文本生成方法实验了预训练神经语言模型生成有毒文本的能力，指出有效的数据选择过程是避免预训练神经语言模型生成有毒内容的必要步骤。

Sep, 2020

GPT-D: 通过有意识地降低人工神经语言模型的能力引发与老年痴呆相关的语言异常

该研究提出了一种新颖的方法，利用 Transformer DL 模型（GPT-2）和与其人为降级版本（GPT-D）之间的困惑度比率，在语言学健康和损伤个体的语言上获得了接近于最先进性能的技术，也演示了通过 GPT-D 产生与 AD 相关的语言异常特征的能力，这对于更好地理解生成神经语言模型的内部工作机制、它们产生的语言以及痴呆症对人类语音和语言特征的不良影响是一步。

Mar, 2022

一种简单的对比学习目标，以缓解神经文本退化

我们提出了对比记号学习目标，它继承了交叉熵和不可能性训练的优点，同时避免了它们的局限性，通过在语言建模和开放域对话生成任务中的全面实验，我们发现所提出的对比记号目标可以使生成的文本重复性减少，提高了生成质量，达到了文本退化的最新性能水平。

May, 2022

控制生成文本的发展

本文旨在通过学习简化的语义分离潜在表示来生成和控制自然语言句子，同时通过变分自编码器和全局属性判别器的组合来建立新的神经生成模型。该模型具有可解释性和高效性，可以生成符合要求的具有各种属性的句子。量化评估验证了该模型的生成准确性。

Mar, 2017

神经生成的即时注意力调节

本研究通过分析语言模型在句子级别的注意力模式，发现神经退化可能与注意机制对任务特征的学习不足有关。因此，提出了一种称为‘实时注意力调节’的方法，该方法在推理过程中向注意力计算注入学习先验知识，有效地改善了语言模型生成的文本的流畅性、创造性和常识推理能力，并显著减少了句子级别的重复。

Jan, 2021

神经对话应答生成的负样本训练

本文提出了一种名为 “负面训练” 的框架，通过寻找令人不满意的行为来微调模型，以显著减少恶意回应，或抑制频繁回应并提高回应多样性。

Mar, 2019