Dec, 2023

通过知识交互改善参数高效微调

TL;DR提出了一种新的 fine-tuning 框架,名为 GIST,通过引入 Gist token 和知识交互的概念,增强了 PEFT 方法在下游任务中的性能,进一步提升了预训练模型对下游任务的理解能力。