Jun, 2024

与人类审美观在检索中对齐的视觉模型:基准和算法

TL;DR利用大型语言模型 (LLM) 的推理能力和美学模型,在一个检索系统中,提出了一种基于偏好的强化学习方法,用于调整视觉模型以更好地与人类美学对齐并提升视觉模型的美学行为。通过使用大型多模型 (LMM) 评估美学表现,并引入名为 HPIR 的新数据集来验证 LMM 的鲁棒性,实验证明了该方法在多个指标下显著提高了视觉模型的美学行为。我们相信该算法可以成为与人类价值观对齐的视觉模型的一种通用方法。