Jun, 2024

能够免费自动对准吗?

TL;DRAlignEZ 是一种使用自动生成的偏好数据和表示编辑来几乎零成本对齐预训练语言模型的新方法,通过减少不必要且提升有利的组件,并利用自动生成的偏好对来识别子空间,这一几乎零成本的过程显著缩小了基本预训练模型和调整模型之间的差距(平均缩小 31.6%),并且可以用作加快更昂贵对齐过程的手段,同时提供了它的有效性条件下的有价值洞察。