Sep, 2024

基于几何平均的软偏好标签优化

TL;DR本研究针对将人类偏好视为二元且确定性的现有算法的不足,提出了分布式软偏好标签,并通过加权几何平均方法改进了直接偏好优化(DPO)。研究表明,该方法能够有效减轻过度优化问题,尤其在使用模糊标签的数据集上表现优越,促进了模型与人类偏好的更好对齐。