Q-Tuning: 基于队列的逐步微调方法用于终身少样本语言学习

ACLApr, 2024

Q-Tuning: 基于队列的逐步微调方法用于终身少样本语言学习

Q-Tuning: Queue-based Prompt Tuning for Lifelong Few-shot Language Learning

Yanhui Guo, Shaoyuan Xu, Jinmiao Fu, Jia Liu, Chaosheng Dong...

TL;DR本研究提出了一种名为 Q-tuning 的新方法，用于持续的提示调优，从而实现了预训练语言模型的终身学习。通过将新任务的提示添加到由旧任务的提示组成的提示队列中，Q-tuning 训练了一个特定于任务的提示。为了更好地传递旧任务的知识，我们设计了一种自适应的知识聚合技术，通过可学习的低秩矩阵重新加权队列中的先前提示。当提示队列达到最大容量时，我们利用基于 PCA 的驱逐规则来减小队列的大小，从而在保留旧任务的主要知识的同时添加新训练的提示。为了减轻由于驱逐而导致的信息丢失的积累，我们额外提出了一个全局共享的前缀提示和基于信息理论的内存保留正则化。广泛的实验证明，我们的方法在持续提示调优基准上显著优于最先进的方法。此外，我们的方法实现了在线性增长任务序列的终身学习，并且在训练和推断中保持恒定复杂度。

Abstract

This paper introduces \textbf{q-tuning}, a novel approach for continual prompt tuning that enables the lifelong learning of a pre-trained language model. When learning a new task, →

q-tuning continual prompt tuning knowledge aggregation pca-based eviction rule lifelong learning

发现论文，激发创造

P-Tuning v2: 提示调节在规模和任务上可以与微调相媲美

通过优化，使用 P-Tuning v2 方法能够在广泛的模型尺度和自然语言理解任务中取得与微调相当的性能，只需调整 0.1%-3% 的参数。

Oct, 2021

Few-shot 统一问答：调整模型还是提示？

该研究探讨了在低资源情境下，两种调节策略（模型与提示）实现统一问答模型的潜力，并使用 16 个 QA 数据集进行了详尽的分析。研究表明，提示调节在良好初始化的几轮训练下，可以和模型调节相媲美，并且参数共享会带来更优的表现，提示初始化的简单知识迁移技术可以有效，提示调节在低资源情境下从预训练中获得了显著的性能提升。本研究为在低资源情景下实现有效和高效问答系统的优点和局限性提供了见解。

May, 2023

对话状态跟踪的继续提示调整

本文提出了一种连续的提示调整参数有效的框架，可避免对旧任务的遗忘并在任务之间实现知识转移，验证实验表明该方法在对话状态跟踪领域中具有有效性和高效性。

Mar, 2022

PPT: 预训练提示调整用于少样本学习

本文提出了一种名为 PPT 的框架，通过在预训练阶段添加软提示来获得更好的初始化，将预训练提示调整用于下游任务可达到或甚至优于整体微调的效果，这对于实际使用大规模预训练语言模型是一种有效和高效的方法。

Sep, 2021

基于规模的参数高效提示微调技术的强大性

通过 prompt tuning 机制，使用 backpropagation 学习 soft prompts 以提升 downstream tasks 的性能，其中 soft prompts 可以与多个 labeled examples 相结合，这种方法比 GPT-3 的 few-shot learning 更有效，并且在语言模型规模达到 10 亿以上时，method 的表现与 model tuning 相匹敌，而且具有更好的领域转移鲁棒性。

Apr, 2021

无需微调？代码智能中的提示微调实验评估

研究表明预训练模型在很多代码智能任务中具有很好的效果，但由于不同形式的输入难以完全利用预训练模型的知识，这篇论文通过在代码智能任务中进行提示调整，探索它对模型性能和低资源情况的影响，实验表明相对于微调，提示调整在三项代码智能任务中都能实现更好的表现，特别是在低资源情况下表现更为优秀。

Jul, 2022

多任务提示调整实现参数效率转移学习

我们提出了多任务提示调整（MPT）方法，该方法通过从多个特定于任务的源提示中提取知识来首先学习一个单一可传输的提示，然后学习该共享提示的乘性低秩更新，以高效地将其适应每个下游目标任务。在 23 个自然语言处理数据集上进行的广泛实验表明，我们的方法在某些情况下优于最先进的方法，包括完全微调基线方法，尽管只有 0.035％的特定于任务的参数被调整。

Mar, 2023

动态提示：一种用于提示调整的统一框架

本文提出了一种动态提示策略 (DP) 来优化 LMs 的 prompt tuning，通过任务优化、位置、长度和提示表示的动态优化，实验证明 DP 能提高分类准确度，并证明其在全数据、少样本和多任务情况下都是有用的。

Mar, 2023

晚阶段调优：晚期提示可能比诸多提示更好

该研究提出了一种名为 Late Prompt Tuning (LPT) 的 PETuning 方法，它将追加的提示插入到 PTM 的中间层而非输入层或所有层，并通过一个神经提示生成器获得实例依赖的提示，具有更快的训练速度和更低的内存成本，可在全数据和少样本场景下实现与全模型调整和其他 PETuning 方法竞争的性能。

Oct, 2022

参数高效的 Prompt 调整使得神经文本检索器具有广义性和校准性

本文介绍了一种基于 Prompt tuning 的神经文本检索方法，通过更新其中 0.1% 的参数，能够显著提高检索模型的泛化性能，在额外引入一份包括 87 个主题的来自学术领域的数据集的情况下，证明了这种检索方法的横向主题泛化性强于传统方法。

Jul, 2022