Feb, 2024

利用双层可学习大语言模型规划增强长期推荐

TL;DR利用大型语言模型的规划能力,提出一种可学习的长期推荐规划框架,结合强化学习和层次学习。实验证实该框架在学习长期推荐规划方面具有优势。