Mar, 2024

小语言模型是否能成为顺序推荐的良好推理者?

TL;DR提出了一种基于知识蒸馏的逐步推理框架(SLIM),以在资源高效的方式下实现顺序推荐系统中的大型语言模型的优秀推理能力,通过基于用户行为序列的 CoT 提示生成的合理性用作标签,将合成的标签融入到更小的学生模型中,从而使学生模型能够在推荐任务中逐步推理,实验结果表明 SLIM 具有显著的有效性和可承受的推荐推理成本。