ACLMay, 2023

不牺牲语言熟练度的情况下学习非语言技能

TL;DR本文提出了一种基于信息论干预和特定技能损失的新型非语言技能注入框架,可使 LLMs 学习严格的算术推理,相比注入非语言技能和保持语言知识的现有技术,我们的模型在使用少量数据且不产生额外合成语言训练数据的情况下表现更好。