未来成功学习解码

Jan, 2017

Learning to Decode for Future Success

Jiwei Li, Will Monroe, Dan Jurafsky

TL;DR介绍了一种简单的、通用的策略，通过插值算法将 MLE-based 令牌生成策略的演员与能够估计所需属性的价值函数批判家结合来修改神经解码器的行为，从而生成具有特定属性（例如，预定长度的序列）的输出。该方法不仅能处理序列长度和后向概率等多种无法通过标准神经序列解码器处理的属性，而且在优化 BLEU 或 ROUGE 得分时能够持续改善概括性摘要和机器翻译。

Abstract

We introduce a simple, general strategy to manipulate the behavior of a neural decoder that enables it to generate outputs that have specific properties of interest (e.g., sequences of a pre-specified length). The model can be thought of as a simple version of the →

neural decoder actor-critic model sequence generation property optimization machine translation

发现论文，激发创造

序列预测的演员 - 评论家算法

本文介绍了一种使用强化学习中的 Actor-Critic 方法来训练神经网络生成序列的方法，利用 Critic 网络来预测输出 token 的值，使得我们可以直接优化诸如 BLEU 等任务特定分数，实现了在监督学习环境下条件 Critic 网络的优化，从而在德语 - 英语机器翻译任务和一些自然语言生成任务中表现出更好的性能。

Jul, 2016

神经机器翻译的可训练贪婪解码

本文提出了一种可训练的解码算法，通过观察和操作神经机器翻译解码器的隐藏状态来最大化任意解码目标，使用确定性策略梯度对其进行培训，在四个语言对和两个解码目标上进行广泛评估，证明我们确实可以训练出一个可训练的贪婪解码器，从而以最小的计算开销生成更好的译文。

Feb, 2017

深度强化学习生成文本

提出了一种基于深度强化学习（Deep Q-Network, DQN）的序列到序列学习中，通过迭代的方式对输出序列进行解码的新型模式，旨在使解码器优先处理较为容易的序列部分，然后再处理较为困难的部分。

Oct, 2015

基于评论引导的控制文本生成解码

本文介绍了一种新型的批判性解码方法来实现语言生成的控制，在控制主题、情感和排毒方面，表现得比以前的方法更好，并且在零 - shot 情况下表现出卓越的泛化能力。

Dec, 2022

神经文本生成器的解码策略

该研究对语言生成任务和解码策略之间的相互作用进行了全面分析，测量了生成文本属性随着解码策略和任务的变化情况，并使用人工和自动评估发现了之前观察到的和令人惊讶的结果，如语言生成中的多样性与质量之间的平衡是非常特定于任务的，而模式搜索方法如光束搜索在机器翻译中表现出色，但在故事生成中会导致不连贯和重复的文本。

Mar, 2022

神经编码器 - 解码器中的输出长度控制

本文提出两种基于解码和两种基于学习的方法，用于控制神经编码器 - 解码器模型的输出序列长度，结果表明学习方法在摘要生成任务中具有控制长度而不降低摘要质量的能力。

Sep, 2016

中间向外解码

提出了一种新的序列生成模型，中心向两侧扩展，使用双重的自我注意机制来控制生成的多样性，并在视频字幕和序列去噪方面取得了显著的改进。

Oct, 2018

计划、关注、生成：具备解码器规划功能的汉字级神经机器翻译

研究在字符级机器翻译中将规划机制与显式对齐的编码器 - 解码器架构相结合，开发了一种计划先行的模型，该模型可以计算源序列和目标序列之间的对齐，并构建一个建议的未来对齐矩阵和一个决策向量以确定是否遵循或重新计算计划。该机制受到了战略关注读者和写作者（STRAW）模型的启发，并通过 WMT'15 语料库上字符级解码器神经机器翻译的三个任务表现优异。我们的分析表明，我们的模型可以计算出具有定性直观性的对齐，并且使用更少的参数可以实现卓越的性能。

Jun, 2017

未来视角：利用大型预训练语言模型进行动态故事生成

本文提出了一种基于预训练生成式 transformer 网络的方法 Future Sight，以实现未来条件限制的故事生成任务，在保留自注意机制的同时，增加了对未来情节的建模，使生成内容更有逻辑性和连贯性。

Dec, 2022

少样本神经序列建模的词汇学习

通过引入词汇翻译机制并使用多种词典学习算法来初始化这种机制，可以提高序列建模任务的系统化泛化能力。

Jun, 2021