基于 Actor-Critic 的摘要生成训练框架

Mar, 2018

基于 Actor-Critic 的摘要生成训练框架

Actor-Critic based Training Framework for Abstractive Summarization

Piji Li, Lidong Bing, Wai Lam

TL;DR介绍使用强化学习的演员 - 评论家框架作为神经网络摘要生成模型培训框架，框架中包括政策网络、二进制分类器、修改的最大近似似然度量和参数学习方法，该框架达到了比现有最优秀方法更好的效果。

Abstract

We present a training framework for neural abstractive summarization based on actor-critic approaches from reinforcement learning. In the traditional neural network based methods, the objective is only to maximize the likelihood of the predicted summaries, no other assessment constrain

neural abstractive summarization actor-critic framework policy network summary quality estimator parameter learning

发现论文，激发创造

基于深度强化学习的自动源代码摘要改进

本文提出一种基于 Actor-Critic 模型和抽象语法树的深度强化学习框架，用于代码摘要。该模型在训练时采用 BLEU 指标进行奖励，实验证明该模型在真实世界数据集上的表现优于一些最先进的方法。

Nov, 2018

序列预测的演员 - 评论家算法

本文介绍了一种使用强化学习中的 Actor-Critic 方法来训练神经网络生成序列的方法，利用 Critic 网络来预测输出 token 的值，使得我们可以直接优化诸如 BLEU 等任务特定分数，实现了在监督学习环境下条件 Critic 网络的优化，从而在德语 - 英语机器翻译任务和一些自然语言生成任务中表现出更好的性能。

Jul, 2016

序列型演员 - 评论家算法在图像字幕生成中的应用

本研究探究了基于 actor-critic 强化学习的图像标题生成模型的训练方法，通过计算每个 token 的优势和值实现直接优化语言质量指标，取得了在 MSCOCO 数据集上的最先进性能。

Jun, 2017

基于课程指导的抽象摘要

本文提出两个方法以弥补 Transformer-based summarization 模型在内容选择方面表现不佳和训练策略效率不高的缺陷，使得模型可以更好的理解要点，同时引入课程学习的方法提高了训练速度和质量，并用 Reddit TIFU 数据集和其他三个跨领域总结测量我们的模型的有效性，同时进行了人类评估表明所提出的方法在流畅性、信息量和整体质量等质量标准上具有良好的效果。

Feb, 2023

一种加强主题感知的卷积序列到序列模型用于抽象文本摘要

本文提出了一种深度学习方法来解决自动摘要任务，通过将主题信息结合到卷积序列到序列 (ConvS2S) 模型中，并使用自举式非监督序列训练 (SCST) 进行优化。通过联合关注主题和单词级别对齐，我们的方法可以通过有偏的概率生成机制改善生成摘要的一致性、多样性和信息量。与 SCST 类似的强化训练直接根据不可微度量 ROUGE 优化所提出的模型，在推理期间也避免了曝光偏差。我们在 Gigaword、DUC-2004 和 LCSTS 数据集上对最先进的方法进行了实验评估。实证结果证明了我们所提出的抽象摘要方法的优越性。

May, 2018

生成对抗网络用于抽象文本摘要

本文提出了一种针对抽象文本摘要的对抗性过程，在其中同时训练了生成模型和判别模型，并使用增强学习构建了生成器，该生成器可以将原始文本作为输入并预测抽象摘要。我们还构建了一个判别器来区分生成的摘要和真实值。经过广泛的实验证明，我们的模型在 CNN / Daily Mail 数据集上达到了具有竞争力的 ROUGE 分数。从质量上看，我们证明了我们的模型能够生成更多抽象、易读和多样化的摘要。

Nov, 2017

稳健神经摘要生成系统及其对抗信息的评估

本文提出了一种基于语义理解的神经生成式摘要模型，通过对显要内容的语义解释学习生成高质量摘要。同时引入一种新的对抗样本评估体制，证明该模型比流行的指针 - 生成式模型更好地识别了离题信息，并且人工评估结果表明本文模型生成的摘要更具信息量和可信度，且冗余度更低。

Oct, 2018

基于神经网络的观点和论证摘要生成

用基于注意力机制的神经网络模型，依据重要性进行采样的方法，生成更优于现有方法的电影评论和争论的摘要。

Jun, 2016

深度强化学习模型用于摘要生成

提出了一种基于编码器 - 解码器和 RNN 的自注意力神经网络模型，通过组合监督和强化学习来训练和生成连贯性和可读性更强的长文摘要，与目前最先进模型相比，在 CNN / Daily Mail 数据集上取得了 41.16 的 ROUGE-1 得分，并且人工评估表明我们的模型产生了更高质量的摘要。

May, 2017

基于神经网络的基于查询的抽象摘要生成

本文提出了一种基于查询的文章摘要生成模型，使用新闻文章摘要数据集训练了指针生成模型，通过与参考摘要的相似度评估生成的摘要，结果表明可以构建类似于抽象式摘要的神经网络模型，使用查询生成有针对性的摘要。

Dec, 2017