使用变分推理发现非单调自回归顺序

ICLROct, 2021

使用变分推理发现非单调自回归顺序

Discovering Non-monotonic Autoregressive Orderings with Variational Inference

Xuanlin Li, Brandon Trabucco, Dong Huk Park, Michael Luo, Sheng Shen...

TL;DR该研究提出了一种无监督、可并行学习的语言模型生成算法，使用置换矩阵表示自回归顺序，并通过多步生成式注意力将其作为目标顺序进行训练，并在语言建模任务中获得了有竞争力或者优秀的表现。

Abstract

The predominant approach for language modeling is to process sequences from left to right, but this eliminates a source of information: the order by which the sequence was generated. One strategy to recover this information is to decode both the content and →

language modeling ordering permutation matrices unsupervised learning transformer

发现论文，激发创造

重塑自回归图生成中的排序思路

本文提出了基于学习的排序方案来解决自回归模型中的图生成和排序问题，并通过实验证明该方案在各种图生成任务上的有效性，鼓舞未来工作进一步探索和发展学习排序方案。

May, 2023

非自回归句子排序

提出了一种新颖的非自回归排序网络，探索了句子之间的双边依赖并并行预测每个位置的句子，实验证明该模型在句子排序任务中优于自回归方法并具有竞争性的性能。

Oct, 2023

一种新颖的变分自编码器及其在生成建模、分类和序数回归中的应用

文中提出了一种新的基于变分自编码器的概率生成模型，该模型使用新颖的方法确定潜在变量先验和强制序数单位，并用于有监督、无监督和半监督学习以及标称和序数分类，实验结果表明该模型在这两方面的分类任务中表现较优。

Dec, 2018

无向序列模型生成顺序的学习和分析

通过强化学习训练预训练的无向翻译模型的生成顺序，从而实现了比从左到右或学习自 Mansimov 等人 (2019) 学习的顺序得到的输出 BLEU 分数更高的翻译结果。

Dec, 2021

基于集合的提示：可证明解决语言模型的序列依赖问题

这篇论文提出了一种技术，可以确保生成式语言模型在给定的子序列集合上不受顺序相关性的影响，从而消除顺序相关性。结果表明，该方法对预期的准确性影响较小，而且可以应用于任何基于 Transformer 的大语料库模型，对文本生成没有影响，进一步讨论了通过修改输入表示可以获得其他强大的 LLM 性能保证的可能性。

Jun, 2024

非单调序列文本生成

本文使用递归二叉树模型，提出了一种用于生成文本的框架，能够训练模型采用非单调生成方式，模型能够直接学习适宜的生成次序，且不需要额外的标注。文章利用模拟学习的方法，从模仿 Oracle 到加强自己的喜好，达到了无需预定生成顺序的文字生成，同时达到了与传统的从左到右生成相当的性能。

Feb, 2019

基于插入的解码方法与自动推断的生成顺序

该论文提出了一种名为 InDIGO 的新型解码算法，该算法通过插入操作支持任意顺序的序列生成，并使用 Transformer 实现。实验结果显示，InDIGO 能够生成遵循任意顺序的序列，同时与传统的从左到右生成方法相比表现出竞争力甚至更好的性能。

Feb, 2019

机器翻译生成顺序的实证研究

本文通过实证研究生成顺序来探讨机器翻译的效果，发现对于英德翻译任务，以字母和最短优先等方式生成的效果相当于标准 Transformer 生成的效果，提出了不必严格遵循从左到右的翻译方式。而对于英中翻译任务，由于语言对齐度低，生成的效果则对生成顺序更加敏感。

Oct, 2019

自动编码变分贝叶斯

本文介绍了一种基于随机变分推理 (Variational Inference) 的学习算法，可以为存在潜变量的、具有难以处理的后验分布的连续概率模型提供有效的推理和学习方法，特别是在大型数据集下具有较好的表现，且已经在实验上得到了验证。

Dec, 2013

语言模型中生成顺序的重要性

这篇研究通过一种新颖的双通路语言模型研究了单词生成顺序对模型质量的影响，发现先生成功能词，再生成内容词的策略最为有效。

Aug, 2018