预训练语言模型为什么有助于下游任务？对头部和提示调整的分析

Jun, 2021

预训练语言模型为什么有助于下游任务？对头部和提示调整的分析

Why Do Pretrained Language Models Help in Downstream Tasks? An Analysis of Head and Prompt Tuning

Colin Wei, Sang Michael Xie, Tengyu Ma

TL;DR论文探究了预训练语言模型在 NLP 任务上的应用，提出了一种基于潜变量生成模型的分析框架，并分别分析了 head tuning 和 prompt tuning 两种方式，在合适的条件下潜变量和分类器之间的关系可以解决下游任务。作者在大量的合成实验中验证了该框架的可行性。

Abstract

pretrained language models have achieved state-of-the-art performance when adapted to a downstream nlp task. However, theoretical analysis of these models is scarce and challenging since the pretraining and downs

pretrained language models nlp latent variable generative model head tuning prompt tuning

发现论文，激发创造

使用 Prompt Tuning 对生成式口语模型进行探索，以处理语音处理任务

本研究首次探讨了基于生成式口语语言模型 (GSLM) 的提示调整范式用于语音处理任务，实验结果表明，与下游精细调整模型相比，提示调整技术使用的可调参数更少，在语音分类任务中实现了较高性能。

Mar, 2022

语言模型如何帮助解决下游任务的数学探索

本文通过数学研究自回归语言模型预训练在下游任务中的应用，提出了将分类任务转化为句子填充任务的假设，证实表现好的语言模型可以是有意义的预训练任务，并给出了相应的数学形式化，同时通过分析认为语言模型可以有助于线性解决分类任务。

Oct, 2020

PPT: 预训练提示调整用于少样本学习

本文提出了一种名为 PPT 的框架，通过在预训练阶段添加软提示来获得更好的初始化，将预训练提示调整用于下游任务可达到或甚至优于整体微调的效果，这对于实际使用大规模预训练语言模型是一种有效和高效的方法。

Sep, 2021

SGL-PT: 具有图形提示调整的强大图形学习器

本文提出了一种名为 SGL-PT 的新框架，其中采用 “预训练、提示和预测” 的学习策略，通过采用有生成和对比自监导的结构图（SGL）和基于口头指导的方式，将预训练和微调统一到了一起，从而在图分类任务方面取得了较好的成果。

Feb, 2023

优化预训练语言模型加速专题投资

Prompt Tuning 对我们通常用 Pretrained Language Models 进行的多标签文本分类任务有着更好的性能和计算效率。

Sep, 2023

关系分类的生成式提示调制

本文提出了一种新的生成式提示调整方法，将关系分类重新构造为一种填充问题，旨在解决当前提示方法的局限性，并在推理期间设计实体导向的解码和判别关系评分以有效地生成和对齐关系，并在完全监督的设置和低资源设置下展示了我们方法的有效性。

Oct, 2022

预训练语言模型在长尾学习中的应用

通过实证研究，发现 prompt-tuning 可以成为良好的 long-tailed 学习器，并探究了该方法背后的关键因素是分类器结构和参数化，而非输入结构。该结果也适用于 few-shot 分类任务。

May, 2022

预训练语言模型的可迁移性研究：来自人工数据集的探讨

本文研究了预先训练语言模型在下游任务中表现卓越的特定特质，包括匹配预训练集和下游任务的词汇统计信息、明确依赖关系和隐式依赖的长度等。实验证明，在预先训练数据的明确依赖关系中加入后，模型的下游性能显著提高。我们发现预先训练模型是有可能在下游任务中学习到虚假的相关性。即使语言模型没有预先在自然语言上进行训练，只要其能够模拟序列中的令牌依赖关系，仍然可以在某些语言任务中获得迁移能力。

Sep, 2021

Prompt-Tuning 在使用多语言语言模型进行跨语言理解方面比 Fine-Tuning 更好

本研究研究了预训练多语言语言模型在零样本跨语言模型传递中的应用，使用 prompt-tuning 进行多语言 NLU 任务（包括句子分类、序列标注和问题解答）中的跨语言评估，并与传统的微调方法进行了比较。结果表明，prompt-tuning 在跨数据集跨语言传递方面比微调表现更好，而且只需调整 0.1% 到 0.3% 的参数。此外，分析表明，prompt tuning 可以在决策边界对齐更好的下游任务上具有更好的跨语言可传递性。

Oct, 2022

无需微调？代码智能中的提示微调实验评估

研究表明预训练模型在很多代码智能任务中具有很好的效果，但由于不同形式的输入难以完全利用预训练模型的知识，这篇论文通过在代码智能任务中进行提示调整，探索它对模型性能和低资源情况的影响，实验表明相对于微调，提示调整在三项代码智能任务中都能实现更好的表现，特别是在低资源情况下表现更为优秀。

Jul, 2022