Oct, 2023

CycleAlign:迭代从黑盒模型到白盒模型的蒸馏,用于更好的人类对齐

TL;DR通过CycleAlign框架,将白盒模型和黑盒模型在低资源情况下有效对齐,通过多次迭代相互作用,动态更新上下文演示,提高黑盒模型的偏好排序能力,实现与人类价值的最先进对齐性能。