Jul, 2024

利用大型语言模型的背景知识提高强化学习的样本效率

TL;DR用大型语言模型(DLLM)提取环境背景知识的框架,可在多个强化学习任务中提高样本效率。