Oct, 2022

AdaMix: 适应混合策略用于参数高效调整的模型

TL;DR提出 AdaMix,在保持大部分 PLM 权重不变的情况下,通过调整每个 Transformer 层中引入的适应模块的混合来优化下游任务的性能,仅调整 0.1-0.2%的 PLM 参数即可胜过 SOTA 参数高效调整和完整模型调整的 NLU 和 NLG 任务。