Sep, 2024

PEDRO:基于提示依赖的参数高效微调表示修改

TL;DR本研究针对大语言模型在多租户框架中的应用,提出了一种新的参数高效微调方法PEDRO。该方法通过在每个Transformer层中集成轻量级向量生成器,依据输入提示生成向量,显著提高了推理效率和下游任务的竞争表现。实验结果表明,PEDRO在相似可调参数数量下超越了现有PEFT基准,显示出重要的工业应用潜力。