PEDRO：基于提示依赖的参数高效微调表示修改

Sep, 2024

PEDRO：基于提示依赖的参数高效微调表示修改

PEDRO: Parameter-Efficient Fine-tuning with Prompt DEpenDent Representation MOdification

Tianfang Xie, Tianjing Li, Wei Zhu, Wei Han, Yi Zhao

TL;DR本研究针对大语言模型在多租户框架中的应用，提出了一种新的参数高效微调方法PEDRO。该方法通过在每个Transformer层中集成轻量级向量生成器，依据输入提示生成向量，显著提高了推理效率和下游任务的竞争表现。实验结果表明，PEDRO在相似可调参数数量下超越了现有PEFT基准，显示出重要的工业应用潜力。

Abstract

Due to their substantial sizes, Large Language Models (LLMs) are typically deployed within a single-backbone multi-tenant framework. In this setup, a single instance of an LLM backbone must cater to multiple users or tasks through the application of various parameter-efficient

发现论文，激发创造

基于实证分析的PEFT技术在LLM中的优势和劣势

本文主要介绍了大型语言模型的fine-tuning方法——parameter-efficient fine-tuning（PEFT），并通过对FLAN-T5模型的综合测试和分析，提出了选择fine-tuning技术的最佳方法，重点考虑任务类型和数据可用性，同时指出了PEFT方法在数据过少的情况下的收敛速度慢的问题，提出了更好的model optimization方法。

Apr, 2023

基于低于4位整数量化的大规模压缩语言模型记忆高效调优

提出了一种基于量化的参数高效微调方法 PEQA，通过一个双阶段的策略将每个全连接层的参数矩阵量化成低比特整数矩阵和标量向量，然后对每个下游任务的标量向量进行微调，从而在模型压缩和加速推理的同时，实现了快速微调和高效任务切换，并在大型语言模型上进行了全面的实验。

May, 2023

IncreLoRA：增量参数分配方法用于参数高效微调

提出了一种增量参数分配方法IncreLoRA，通过根据每个模块的重要性得分，在训练期间自适应地添加可训练参数，以应对有限训练条件下参数剪枝的限制，实现更高的参数效率，并在低资源设置下显著优于基准方法。

Aug, 2023

面向更高参数效率的大语言模型微调：一篇立场论文

该研究论文从参数高效微调（PEFT）对大语言模型（LLMs）的迫切需求出发，强调了当前状态和进一步研究该主题的必要性，以及需要解决的重要挑战和开放问题，包括创新PEFT架构、不同学习设置的PEFT、结合模型压缩技术的PEFT以及多模态LLMs的PEFT探索。通过提出该立场论文，我们旨在激发进一步的研究，并促进围绕LLMs的更高效和可访问的PEFT的讨论。

Nov, 2023

预训练语言模型的参数高效微调方法：关键评估与考察

预训练语言模型与基于它们的参数高效微调方法被综合评述，重点讨论了内存效率和计算资源限制等参数效率问题以及应用于下游任务的挑战和机遇。

Dec, 2023

HydraLoRA：一种用于高效微调的非对称LoRA架构

通过一系列实验，我们发现了两个关键的见解，揭示了LoRA的训练和参数效率问题，基于这些见解，我们开发了HydraLoRA，这是一个具有不对称结构的LoRA框架，消除了对领域专业知识的需求，我们的实验表明，HydraLoRA优于其他PEFT方法，即使在训练和推断阶段依赖领域知识的情况下。

Apr, 2024

多模态大语言模型参数高效微调的实证研究

使用四种常见的PEFT方法对开源MLLMs的LLM组件进行微调，比较它们在参数效率方面的表现，结果显示adapter是效果最好的PEFT方法。

Jun, 2024

逐步解锁以实现大语言模型的参数高效微调

本研究解决了在下游任务中微调大语言模型所需的高计算资源问题。我们提出了一种新的选择性参数高效微调方法ID³，能够动态评估参数重要性并平衡探索与利用，从而提高计算效率。实证研究表明，ID³在多个任务上显著优于传统的基于固定掩码的微调技术。

Aug, 2024

逐步解封高效参数微调大语言模型

本文研究了解决大语言模型微调时计算资源消耗大的问题。提出了一种名为ID³的新方法，通过动态评估参数重要性，以平衡探索与利用，对参数进行选择性微调，显著提升了微调效率与性能。研究表明，ID³能够将梯度更新次数减少一半，从而提高计算效率，并能与现有框架无缝集成。

Aug, 2024

HUT：一种更具计算效率的哈达玛更新变换微调方法

本研究解决了预训练语言模型在微调时面临的计算复杂性问题。提出了一种直接更新变换（UT）范式，构建了从原始参数到更新参数的直接变换，进而引入了哈达玛更新变换（HUT）方法，通过低秩矩阵高效更新权重矩阵，保持原始和更新参数之间的相关性。理论和实验结果表明，HUT在模型质量上与其他参数高效微调方法相当或更优，同时明显降低了计算复杂性。

Sep, 2024