Mar, 2024

概念感知数据构建改善语言模型的上下文学习

TL;DR通过概念感知训练框架构建训练场景,提高预训练变换器在上下文学习过程中利用新的潜在概念的能力,并使这种能力使得上下文学习对先前模型的功能性缺陷更具鲁棒性,相对于传统指令优化,在大多数新任务上具有更好的效果,并且训练数据规模相当的情况下,表现与先前的上下文学习模型相当。