非自回归文本生成的扩散模型：一项调查

Mar, 2023

非自回归文本生成的扩散模型：一项调查

Diffusion Models for Non-autoregressive Text Generation: A Survey

Yifan Li, Kun Zhou, Wayne Xin Zhao, Ji-Rong Wen

TL;DR本文系统介绍了最新的扩散模型在 NAR（非自回归）文本生成领域中的进展，重点介绍了扩散模型的核心设计、预训练语言模型的应用，以及优化技术等。该综述旨在为研究人员提供一个有关文本扩散模型的系统参考。

Abstract

Non-autoregressive (NAR) text generation has attracted much attention in the field of natural language processing, which greatly reduces the inference latency but has to sacrifice the generation accuracy. Recently, diffusion models, a class of latent variable generative models, have be

non-autoregressive text generation diffusion models latent variable generative models pre-trained language models optimization techniques

发现论文，激发创造

NLP 中的扩散模型：一项调查

本文对自然语言处理中的扩散模型进行了全面的综述，讨论了不同的模型形式、优势和局限性，以及自然语言生成、情感分析、主题建模和机器翻译等应用。与自回归模型相比，扩散模型具有在生成、插值、令牌级控制和鲁棒性方面的显着优势。未来的研究方向包括把 Transformers 和扩散模型更深层次的结合，发展具有优秀的 few-shot learning 能力的多模态扩散模型和大规模扩散语言模型。

May, 2023

AR-Diffusion: 自回归扩散模型用于文本生成

介绍了一种新的生成文本的方法 - 自回归扩散 (AR-Diffusion)，它通过引入动态去噪步骤来解决自然语言中的顺序依赖问题，在各种文本生成任务中表现优异。

May, 2023

神经机器翻译及其扩展中的非自回归生成调查

本文对不自回归生成（NAR）进行了系统的调查，并比较和讨论了不同方面的各种非自回归翻译（NAT）模型，包括数据处理、建模方法、训练标准、解码算法以及受到预训练模型的好处，同时简要回顾了 NAR 模型在机器翻译以外的其他应用，并讨论了未来探索的潜在方向。

Apr, 2022

Diffusion-NAT：自提示离散扩散用于非自回归文本生成

本文提出 Diffusion-NAT，将离散扩散模型引入 NAR 文本生成，并结合 BART 改进性能，实现了 BART 的解码过程与 DDM 的去噪过程统一，最终结果表明，我们的方法在 7 个数据集上取得了很好的效果，甚至超过了自回归方法。

May, 2023

自然语言处理中的扩散模型研究

本文概述和推导了扩散模型的基本理论，回顾了扩散模型在自然语言处理领域的研究结果，并对齐进行了分析和总结，最后记录了本次文献综述研究的经验和感受。

Mar, 2023

文本扩散模型的迁移学习

我们研究了文本扩散能否替代自回归（AR）解码用于大型语言模型（LLMs）的训练和部署，并测试了通过一种轻量级适应过程称为 ``AR2Diff'' 将预训练的 AR 模型转换为文本扩散模型的潜力。我们发现，训练仅具有前缀 LM 目标的解码器模型在多项任务中表现最好。此外，我们还观察到通过 AR2Diff 对 AR 模型进行改进，并发现使用扩散解码的扩散模型比 AR 模型在多种情况下表现出更好的结果。这些结果非常有前景，因为相对未被充分探索的文本扩散比长文本生成的 AR 解码速度更快。

Jan, 2024

非自回归模型的序列生成研究

该研究通过提出一种分析模型来表征 Non-autoregressive 模型生成不同序列任务的难易程度，并发现知识蒸馏和源 - 目标对齐技术可以帮助提升 Non-autoregressive 模型的准确性，减少目标序列的依赖性。

Apr, 2020

利用潜在语言扩散模型生成多样化段落的规划器

本文提出了组合自回归生成模型与潜在语义扩散的 PLANNER 模型用于全局控制段落文本生成，并在各种条件生成任务上进行了评估。结果表明，该方法有效地生成了高质量的长篇文本。

Jun, 2023

语言生成的潜在扩散

该研究论文讨论了扩散模型在离散领域（如语言）的应用，提出将扩散模型作为基于预训练语言模型的生成算法的辅助方法，并通过在预训练的编码器 - 解码器模型的潜在空间中学习连续的潜在扩散模型，演示了其在从数据分布中生成文本方面的有效性。最终提出的潜在扩散模型不仅在生成新颖文本方面优于强有力的自回归基线，还支持可控的生成。

Dec, 2022

一个重新参数化的离散扩散模型用于文本生成

本研究使用离散扩散概率模型研究自然语言生成，提出了一种重新参数化离散扩散模型，并进行了大量实验以证明其在文本生成能力上的显著改进。

Feb, 2023