Oct, 2023

面向随时调优的持续预训练语言模型与超网络提示

TL;DR通过超网络生成领域特定的提示,以解决一直持续预训练方法在新领域性能下降的问题,并促进跨领域的知识迁移。该方法在两个真实数据集上实现了 3.57% 和 3.4% 的改进,证明其有效性。