Jun, 2024

经过精心策划的数据的自消费生成模型可证明优化人类偏好

TL;DR在本文中,我们理论上研究了数据筛选对生成模型的迭代重新训练的影响,并表明它可以看作是一种隐式偏好优化机制,通过实验证明了该过程加剧了奖励模型的偏见。