Nov, 2023

SAIE 框架:单一的支持是不够的 —— 通过对抗性评注推进 LLM 培训

TL;DR通过学习中的交互式讨论,我们的 SAIE 训练方法提升了大型语言模型在训练阶段对实例的理解能力和在推理阶段的逻辑 / 批判性思维能力和表达能力。实验结果表明,使用我们的方法微调的模型在多个数据集上均优于使用标准微调技术训练的模型,尤其在多智能体推理情景下,我们的方法表现出卓越的推理能力。