Jun, 2024

关于推荐的 Softmax 直接偏好优化

TL;DR基于语言模型的推荐系统利用 Softmax-DPO 方法将排序信息融入语言模型中,以帮助提高推荐系统的性能和用户个性化偏好建模能力。