Jun, 2024

探究上下文学习的预训练动态:任务识别与任务学习

TL;DR利用预先训练的先验知识,通过任务识别和任务学习两种能力的竞争来促进上下文学习的出现,并提出了一种简单而有效的方法,在推理时间内更好地整合这两种能力。通过自适应集成学习,可以显著提高上下文学习的性能,使两个小模型的性能超过具有两倍参数的大模型。