Aug, 2024

I-SHEEP:通过迭代自我增强范式从零开始自我对齐的LLM

TL;DR本研究解决了大型语言模型(LLM)在主动学习和自我对齐方面的空白,提出了I-SHEEP这一人类般的自我对齐范式,让LLM能够从零开始持续自我增强。研究表明,I-SHEEP在多个基准测试中显著提升了模型能力,最大相对提升达78.2%,为LLM的持续自我改进提供了新思路。