Mar, 2024

优化大型语言模型的排序器

TL;DR这篇论文通过引入具有对齐的列表排名目标的语言模型框架(ALRO)来解决基于 LLMs 的推荐系统中排名任务的问题,并使用适应语言生成任务的 soft lambda loss 和解决位置偏差的置换敏感学习机制,实验证明 ALRO 优于现有的基于嵌入的推荐方法和基于 LLMs 的推荐基准。