Jul, 2024
利用大型语言模型的背景知识提高强化学习的样本效率
Improving Sample Efficiency of Reinforcement Learning with Background Knowledge from Large Language Models
Fuxiang Zhang, Junyou Li, Yi-Chen Li, Zongzhang Zhang, Yang Yu...
TL;DR用大型语言模型 (DLLM) 提取环境背景知识的框架,可在多个强化学习任务中提高样本效率。