SwitchCIT：用于大型语言模型的持续指令调整的切换

Jul, 2024

SwitchCIT：用于大型语言模型的持续指令调整的切换

SwitchCIT: Switching for Continual Instruction Tuning of Large Language Models

Xinbo Wu, Max Hartman, Vidhata Arjun Jayaraman, Lav R. Varshney

TL;DR该研究讨论了在大规模语言模型中出现的连续指导调整中的灾难性遗忘问题，并通过一种切换机制来解决此问题，使计算能够路由到参数高效调整的模型，该方法通过实验表明其在不同自然语言生成任务的连续指导调整中具有显著有效性。

Abstract

large language models (LLMs) have exhibited impressive capabilities in various domains, particularly in general language understanding. However these models, trained on massive text data, may not be finely optimized for specific tasks triggered by instructions. →

发现论文，激发创造

精细调整的语言模型是持续学习者

通过自我监督预训练不断学习的大型语言模型，可以在多个数据集上持续学习并保持先前任务的良好性能，同时展示新的组合方式。

May, 2022

Dynosaur:一种动态生长范式用于指令调整数据策划

本文提出了 Dynosaur，一种基于现有 NLP 数据集元数据的动态增长范式，用于构建 LLM 的指令调整数据，同时研究将连续学习作为指令调整的一种新方法，并演示了在任务表示选择方面进行任务重演的有效性。

May, 2023

大型语言模型在连续微调中的灾难性遗忘的实证研究

大型语言模型在不断微调的过程中存在灾难性遗忘现象，尤其随着规模的增加，遗忘的严重程度也加剧，然而通过单独解码器模型BLOOMZ与编码器-解码器模型mT0的比较，发现BLOOMZ遗忘较少且保留更多知识，还观察到语言模型能够在不断微调中缓解语言偏见，同时通用指令微调有助于减轻大型语言模型在进一步微调过程中的遗忘现象。

Aug, 2023

TRACE：大规模语言模型连续学习的全面基准

通过引入TRACE评估标准，本文介绍了大规模语言模型连续学习的挑战，并提出了RCL方法，将任务特定的线索与元理由相结合，以减少LLMs中的灾难性遗忘现象并加快对新任务的收敛。

Oct, 2023

CITB：一个连续指令调整的基准

该研究针对持续学习中的指令调整问题建立了一个基准，并通过研究对话任务流的方法系统地研究了不同的持续学习方法。实验结果显示现有的持续学习方法未能充分利用丰富的自然语言指令，顺序微调指令调整模型可以产生相似或更好的效果。研究进一步探索了可能影响指令调整学习的不同方面。希望该基准能够促进这个研究方向的更多研究。

Oct, 2023

对齐的大型语言模型连续预训练中的遗忘现象研究

连续预训练中灾难性遗忘现象对于已经经过微调的大规模语言模型的影响及重复问题的挑战。

Jan, 2024

大型语言模型的持续学习：一项调研

该论文调研了关于大型语言模型（LLMs）的持续学习方面的最新工作，提出了一种新颖的多阶段分类方案，涉及持续预训练、指令调整和对齐；对LLMs的持续学习与更简单的小模型的适应方法以及其他增强策略进行对比；同时，在讨论基准和评估的基础上，提出了几个挑战和未来工作方向。

Feb, 2024

大型语言模型中的连续预训练探索：洞见与影响

这篇论文研究了大型语言模型（LLMs）中不断学习（CL）领域的发展，重点是开发高效和可持续经验的训练策略。通过不断适应域预训练，我们的研究评估了LLMs在不同数据环境中的适应性和能力，并引入了一个新的基准来衡量这种适应能力，揭示了关于知识转移和模型大小的若干关键见解。

Feb, 2024

不要半听半信：连续指令调优中关键部分信息捕捉

通过关键部分信息增益（KPIG）的动态重播数据和优化训练目标，我们提出了一种新的大语言模型（LLMs）的连续指令调整方法，从而使LLMs能够捕捉与正确响应相关的任务感知信息，并减轻对指令中的一般描述的过拟合。实验表明，我们的方法在已知任务和未知任务上实现了卓越的性能。

Mar, 2024

大规模语言模型的持续学习：一项综合调研

对大型语言模型在持续学习、预训练、微调以及评估协议方面进行综述.

Apr, 2024