Jun, 2024

示范而非说明:用示范反馈来对齐语言模型

TL;DR通过使用在线比较数据与用户示范作为反馈,DITTO 方法通过设置少量示范来将语言模型输出与用户的行为对齐,有效地进行语言模型的个性定制。