Jun, 2024

状态汤:上下文技能学习、检索和混合

TL;DR探索利用状态序列模型的内部状态作为任务向量进行快速模型合并的方法,并通过简单的线性状态插值方法提高下一个标记的困惑度和上下文学习任务性能。