Mar, 2024

CLHA: 人类对齐的简单而有效的对比学习框架

TL;DR通过对比学习实现人机对齐的简单而有效框架,以提高大型语言模型与人类偏好的一致性。