Jan, 2024

Hi-Core:层次化知识迁移用于连续性强化学习

TL;DRHi-Core 是一个新颖框架,用于在连续强化学习中增强高层次的知识传递,并通过大型语言模型(LLM)进行目标设置和低层次策略学习,并通过知识库存储策略实现层次化知识传递,实验证明其在处理多样化 CRL 任务上的有效性优于常见的基线模型。