Mar, 2024

大型语言模型的可控推荐

TL;DR通过引入监督学习任务和基于强化学习的对齐过程,本研究明显提升了大型语言模型在推荐系统中遵循指示并保持高精度性能的能力。