ICMLJun, 2024

通过 Nash 学习和自适应反馈进行语言对齐

TL;DR借助 Nash 学习和自适应反馈的语言对齐算法(LANA)消除了学习偏好模型或存在注释数据集的需求,实现了大规模语言模型对齐的自我对齐能力。