Jun, 2024

纷扰的细粒度反馈:超越赞 / 踩 —— 面向文本到图像生成的挑战

TL;DR通过对真实数据和合成偏好数据的实验,我们发现精细的反馈不一定总是优于粗略的反馈,根据模型选择、反馈类型和人类判断与计算解释的一致性的相互作用存在的复杂性,我们确定了精细反馈获取和利用的关键挑战,这促使我们重新评估其所假设的优势和实用性。我们的发现表明,在某些情况下,对于固定预算,精细的反馈可能导致更差的模型;然而,在已知属性的受控环境中,精细的奖励确实可以更加有帮助,这需要仔细考虑反馈属性并可能呼唤新的建模方法来合理地挖掘精细反馈在实际应用中的潜在价值。