May, 2023

通过与学习助手的合作交互,从错误中学习

TL;DR本文提出了一种名为 SALAM(Study Assistant for Large Language Model)的框架,通过对先前反馈进行评分并收集培训阶段的错误,以在推断过程中为语言模型提供指南,从而协助其进行自我反思和提炼,从而显著提高了绩效。