BriefGPT.xyz
Ask
alpha
关键词
high-level policy formulation
搜索结果 - 1
Hi-Core:层次化知识迁移用于连续性强化学习
Hi-Core 是一个新颖框架,用于在连续强化学习中增强高层次的知识传递,并通过大型语言模型(LLM)进行目标设置和低层次策略学习,并通过知识库存储策略实现层次化知识传递,实验证明其在处理多样化 CRL 任务上的有效性优于常见的基线模型。
PDF
5 months ago
Prev
Next