Aug, 2022

PANDA:有效模型适应的提示转移与知识蒸馏相遇

TL;DR该研究提出了一种新的度量方法和PANDA方法来解决预训练语言模型中的prompt转移问题,PANDA方法使用知识蒸馏技术来迁移源prompt中的知识到目标prompt中,从而避免源知识的灾难性遗忘。实验证明,该方法在各种PLM尺度场景下的性能均优于传统的prompt转移方法和模型调参方法。