使用网格束搜索进行序列生成的词汇约束解码

ACLApr, 2017

使用网格束搜索进行序列生成的词汇约束解码

Lexically Constrained Decoding for Sequence Generation Using Grid Beam Search

Chris Hokamp, Qun Liu

TL;DR介绍了 Grid Beam Search 算法，可以在任何生成序列的模型中使用，通过词汇约束来扩展 beam 搜索，并且在进行交互式预测翻译和领域自适应翻译实验中表现出良好的性能提升。

Abstract

We present grid beam search (GBS), an algorithm which extends beam search to allow the inclusion of pre-specified lexical constraints. The algorithm can be used with any model that generates a sequence $ \mathbf{

grid beam search lexical constraints neural interactive-predictive translation domain adaptation performance

发现论文，激发创造

神经机器翻译中基于动态波束分配的快速词汇约束解码

该论文旨在介绍一种新的机器翻译解码算法 —— 词汇约束解码法，该算法能够快速而准确地在输出中包含预定的单词和短语，并探索模型与 BLEU 得分之间的关系，与此同时它还能够极大地优化计算复杂性。

Apr, 2018

基于灵活语法约束解码的语言模型

本论文研究了 LLMs 在信息提取等任务中生成复杂输出结构的问题，提出了一种基于形式语法约束的解码方法，通过合理的限制保证生成的符号序列能够具有语法正确性，同时在大型符号集信息提取和实体消歧方面取得了良好的效果，结果表明在缺乏训练数据、后调较为昂贵的场景下，采用基于形式语法约束的解码策略能够有效提升模型生成结构化输出的能力。

May, 2023

神经序列模型的多样性束搜索：解码多样性解决方案

提出一种名为 Diverse Beam Search (DBS) 的算法，以优化多样性目标解码出一系列多样化的输出，旨在解决 Beam Search 算法在复杂人工智能任务解码过程中无法准确捕捉复杂任务本质的问题，并在图像字幕生成、机器翻译和视觉问答生成等任务中取得更好的性能表现。

Oct, 2016

利用 Levenshtein 变换的受词汇约束的神经机器翻译

本文提出了一种在神经机器翻译中加入词汇约束的简单有效算法，该算法可以在推理时注入术语约束，而不影响解码速度，并且无需修改训练流程，使用自定义字典即可运行，实验结果表明，我们的方法在英德 WMT 数据集上可以提高基线和之前方法的翻译质量。

Apr, 2020

一种稳定有效的可训练贪婪解码学习策略

本文提出了一种灵活的新方法，利用一个小型的神经网络 actor 来观测和操纵先前训练的解码器的隐藏状态，以无需额外的计算成本获得几乎全部的 beam search 带来的好处。我们介绍了使用一个伪并行语料库来训练 actor 网络，它是以类似于 BLEU 的目标质量指标对基础模型的 beam search 输出排名而生成的。我们的方法受到了早期研究的启发，但不需要强化学习，并且可以可靠地在各种模型上训练。在三个平行语料库和三个架构上的实验表明，该方法可以使翻译质量和速度大大提高，超过每个基础系统。

Apr, 2018

神经序列预测中的生成桥接网络

本文提出了一种新的序列预测模型 —— 生成式桥接网络 (GBN)，GBN 引入了一个桥接模块来辅助生成模型的训练，将点预测扩展到一个基于条件概率的桥接分布上，并最小化生成模型与桥接分布的 KL 散度，结果表明，针对语言模型、抽象文本摘要等任务，我们提出的 GBN 模型均具有显著的性能提升。

Jun, 2017

双向束搜索：神经序列模型的前向 - 后向推理用于填空图像字幕生成

开发 Bidirectional Beam Search（BiBS）算法来逼近推理双向神经序列模型中的 1-Best（和 M-Best）解码，并在可视化任务中验证该方法的高效性和效果。

May, 2017

神经文本生成的显式句法指导

我们提出了一种基于句法树的语法引导生成模式，通过解码过程的两个部分:（1）对给定源句子中词汇化的句法上下文中的每个成分预测填充文本；（2）映射和扩展每个成分以构建下一级语法上下文以生成自然语言文本，并在重述生成和机器翻译上进行了实验。与自回归基线相比，该方法在有效性和可解释性方面更加出色。

Jun, 2023

BFGAN：用于词汇约束句子生成的前向和后向生成对抗网络

提出了一种名为 BFGAN 的新算法框架，通过使用向前和向后生成器一起生成词汇限制句子，并使用鉴别器通过分配奖励信号来指导两个生成器的联合训练，以解决向基于 RNN 的模型中直接引入词汇约束所面临的挑战。

Jun, 2018

带有 Gumbel-Greedy 解码的神经机器翻译

本文提出了一种使用 Gumbel-Greedy Decoding 训练生成网络来预测翻译的方法，该方法使用 Gumbel-Softmax 重新参数化来实现对离散单词序列的可微分训练，实验证明其有效性。

Jun, 2017