Jan, 2024

通过组合拓展能力的 LLM 增强 LLMs

TL;DR通过提出 CALM,即 Composition to Augment Language Models,我们研究了现有基础模型与特定模型的有效和实用组合,以赋予其新的能力。CALM 通过引入模型之间的交叉关注来组合它们的表示,并实现新的功能。在实验证明,将 PaLM2-S 与在资源稀缺语言上训练的较小模型相结合,可以在英语翻译和低资源语言的算术推理等任务中带来最高 13%的绝对改进;同样,当 PaLM2-S 与特定于代码的模型相结合时,在代码生成和解释任务上与完全微调的模型相比,性能提升了 40%。