Aug, 2022

PANDA:有效模型适应的提示转移与知识蒸馏相遇

TL;DR该研究提出了一种新的度量方法和 PANDA 方法来解决预训练语言模型中的 prompt 转移问题,PANDA 方法使用知识蒸馏技术来迁移源 prompt 中的知识到目标 prompt 中,从而避免源知识的灾难性遗忘。实验证明,该方法在各种 PLM 尺度场景下的性能均优于传统的 prompt 转移方法和模型调参方法。