透过梯度学会使用新标记进行神经文本生成

ICMLJun, 2021

透过梯度学会使用新标记进行神经文本生成

Straight to the Gradient: Learning to Use Novel Tokens for Neural Text Generation

Xiang Lin, Simeng Han, Shafiq Joty

TL;DR本文引入了 ScaleGrad，一种对梯度的改进方法，解决了 MLE 在训练模型中会优先使用枯燥、重复短语的问题，并通过直接操纵梯度信息使模型学习使用新颖标记，该方法不仅在无限制生成中表现良好，而且在定向生成任务中也有效。

Abstract

Advanced large-scale neural language models have led to significant success in many language generation tasks. However, the most commonly used training objective, Maximum Likelihood Estimation (MLE), has been shown problematic, where the trained model prefers using dull and repetitive

neural language models training objective gradient manipulation text generation scalegrad

发现论文，激发创造

逐句平滑规则化用于序列到序列学习

通过使用句子级的规则化方法，解决了在序列模型训练中，最大似然估计普遍存在的非平滑预测概率问题，并取得了在神经机器翻译任务中优越的性能。

Dec, 2018

语言 GANs 的不足

本篇论文研究自然语言生成中存在的曝光偏差问题，指出了评估基准的不足之处，并证明在整个质量和多样性空间中，最大似然估计（Maximum-Likelihood）模型在质量和多样性方面表现优于对抗性变体，且温度调整提供了更好的质量 / 多样性权衡。

Nov, 2018

大边际神经语言模型

我们提出了一种大间隔准则来训练神经语言模型，该模型的训练与最小化困惑度不同，通过增加语句的 “好” 和 “坏” 的间隔以进行特定任务的再评分，实验证明我们的方法在语音识别上可以减少 1.1 WER，在机器翻译中可以增加 1.0 BLEU。

Aug, 2018

TextGrad: 自动文本 “差异化

AI 正处于一个新的转变时期，TextGrad 是一个强大的框架，通过文本实现自动 “微分”, 可以改善复合人工智能系统的各个组件，这是开发下一代人工智能系统的基础之一。

Jun, 2024

从零开始训练语言 GANs

本研究通过采用大批处理、密集奖励和鉴别器规则等现有技术来稳定和改善语言生成对抗网络，从而成功实现了 ScratchGAN 的从零训练，并表明其在语料库 EMNLP2017 News 和 WikiText-103 上的质量和多样性指标相当于最大似然训练。

May, 2019

TextGrad: 基于梯度驱动优化的 NLP 鲁棒性评估进展

在 NLP 领域缺乏第一阶梯度的鲁棒性评价框架，本文提出 TextGrad，一种新的基于梯度驱动的攻击生成器，支持高准确性和高质量的文本鲁棒性评估，并通过实验验证了其在攻击生成和防御等方面的有效性。

Dec, 2022

超越 MLE：文本生成的凸学习

基于凸函数的训练目标提供了一种新颖的方法，使得文本生成模型能够聚焦于高概率输出，同时增强了自回归模型与非自回归模型的生成能力。

Oct, 2023

梯度上升后训练增强了语言模型的泛化能力

本文发现使用梯度上升后训练预训练语言模型可以增强其零样本泛化能力，特别是使用 Gradient Ascent Post-training 方法可以让语言模型在 12 个不同的 NLP 任务上达到与 2-3 倍大的模型相媲美的水平，并且可以提高 LM 的泛化能力而无需进行任何特定任务的微调。

Jun, 2023

Grad2Task: 使用梯度表示任务的改进少样本文本分类

本文提出了一种基于条件神经过程的方法，用于 few-shot 文本分类，通过从其他各种丰富注释的任务中迁移学习，利用梯度信息从基础模型中表示每个任务，并训练一个调整网络来调整一个文本分类器，受任务表示的条件约束，实验结果表明，这种方法在多个 few-shot 任务上的表现优于传统的 fine-tuning、序列迁移学习和最先进的元学习方法。

Jan, 2022

朝向连贯且凝聚的长文本生成

本文提出了一种新的神经语言模型，它具备两个神经鉴别器，可以在句子层面（内聚性）和段落层面（连贯性）提供反馈信号，并且使用了一种称为负关键序列训练的简单而有效的策略梯度方法进行训练。结果表明，相对于基线（基于双向 MLE 训练的复发关注神经语言模型），我们的方法有效改善了模型表现。

Nov, 2018