Jul, 2024

大型语言模型的对齐技术综合调研:RLHF、RLAIF、PPO、DPO及更多

TL;DR本研究解决了大型语言模型(LLMs)对齐技术缺乏系统性综述的问题。通过对现有方法进行分类和详细描述,本文为读者提供了对该领域当前状态的透彻理解。研究表明,尽管有多种方法提升模型的对齐性,但整体认识仍显不足。