基于鉴别器引导的 MCTS 解码的受限文本生成

ACLSep, 2021

基于鉴别器引导的 MCTS 解码的受限文本生成

PPL-MCTS: Constrained Textual Generation Through Discriminator-Guided MCTS Decoding

Antoine Chaffin, Vincent Claveau, Ewa Kijak

TL;DR本文通过指导树遍历过程中使用鉴别器推导所需的限制条件，探讨了如何在解码过程中进一步控制基于 Transformers 的大型语言模型（LM）生成的长文本，从而避免对 LM 进行微调。此方法相对于微调又更易于并且训练代价更小，同时允许更细致、更动态地应用限制条件。在评估了多种搜索和重新排序方案后，表明基于鉴别器引导的 Monte Carlo Tree Search 解码方法可以在两种限制条件和语言（法语和英语）中以最先进的效果，得到多样性鼓励下基于重新排序的其他解码方法相当好的效果。

Abstract

large language models (LM) based on transformers allow to generate plausible long texts. In this paper, we explore how this generation can be further controlled at decoding time to satisfy certain constraints (e.

large language models transformers constrained generation monte carlo tree search discriminator-guided decoding

发现论文，激发创造

解锁预期文本生成：一种受限方法用于大型语言模型的忠实解码

通过将文本生成问题形式化为未来约束生成问题，以最小化不良行为并确保指令的忠实执行，本文介绍了利用 LLM 的未来约束满足估计来指导文本生成过程的方法，并通过对关键词受限生成、有害性降低和问答中的事实正确性等三个不同的文本生成任务进行了广泛的实验，证明了该方法的有效性。

Dec, 2023

准确引导 LLMs 的快速非侵入式约束生成

为了确保大型语言模型生成的文本符合预期格式，本论文提出了一种名为 DOMINO 的创新解码算法，能够以完全子词对齐的方式执行约束，同时利用预计算和推测解码来几乎不增加开销，有时甚至实现接近 2 倍的速度优化，从而在很大程度上胜过现有方法。

Feb, 2024

基于评论引导的控制文本生成解码

本文介绍了一种新型的批判性解码方法来实现语言生成的控制，在控制主题、情感和排毒方面，表现得比以前的方法更好，并且在零 - shot 情况下表现出卓越的泛化能力。

Dec, 2022

带语言约束的可控文本生成

本篇论文提出了使用自然语言指定限制条件的语言模型的文本生成任务，并创建了挑战性的基准 Cognac。我们提出了一种名为 CognacGen 的方法，旨在利用语言模型的内部知识来引导生成，它可以成功地推广到未看到的指令，并在生成符合限制的文本方面优于竞争基线。

Dec, 2022

组合约束满足的语言生成：一种树搜索增强的蒙特卡罗方法

提出了一种适用于语句生成的组合约束规范框架，通过采用高效的方法生成满足约束条件的语句，并将树搜索算法嵌入到蒙特卡罗马尔可夫链（MCMC）的候选提议过程中以探索满足更多约束条件的候选者，实验表明，这种方法在多个语言生成任务中实现了一致和显著的改进。

Nov, 2020

大型语言模型的有约束文本生成的综合评估

通过在大型语言模型中引入详细的约束条件，本研究调查了约束文本生成的问题，并对多个语言模型进行了分类和评估，旨在为未来的约束文本生成提供启示。

Oct, 2023

一种插拔式控制文本生成方法

通过向语料库单词的概率分布添加位移来控制语言生成，能保证给定的关键词出现，相比类似方法具有更高的效果。

Sep, 2021

合作文本生成的判别器选择

本文研究语言模型在生成自然文本时采用协同解码策略，使用三种基于 Transformer 的分类器，并提供用于实验的基于 Monte Carlo Tree Search 的批量实现代码，比较它们在分类准确性、样本质量和计算性能等方面的优缺点。

Apr, 2022

面向开放域创造力和公平性的可控文本生成

本文介绍了一些控制文本生成的方法以增强语言生成模型的创造力和公平性，包括层级生成和约束解码，并应用于故事、诗歌、比喻语言的创意生成，以及减少生成模型的社会偏见。

Sep, 2022

约束优先：一个基于 MDD 的生成句子模型

该论文介绍了一种生成强约束文本的新方法，将标准化句子生成应用于视力筛查，采用多值决策图 (MDD) 处理约束条件，并利用语言模型 (GPT-2) 获取最佳句子，该方法在标准化句子生成领域取得了重大突破。

Sep, 2023