BriefGPT.xyz
大模型
Ask
alpha
关键词
curricula
搜索结果 - 6
多智能体强化学习中的协作课程学习
在多智能体环境中,通过使用降低技能水平的协作队友为学习代理制定学习课程,能够同时实现任务完成与整体团队奖励最优。
PDF
6 months ago
跨时序课程设计用于 Transformer 代理
我们提出了一种新的算法,跨迭代课程(CEC),以提高 Transformer 智能体的学习效率和泛化能力。CEC 的核心是将跨迭代经验放入 Transformer 的上下文中,形成课程的基础。通过顺序地构建在线学习试验和混合质量演示,CEC
→
PDF
9 months ago
关于最优传输在课程强化学习中的益处
通过将课程设置为任务分布之间的插值,将生成课程作为约束优化传输问题来提高课程强化学习(CRL)方法的性能,从而在具有不同特点的各种任务中取得高性能。
PDF
9 months ago
通过课程强化学习的方法对球形摆进行跟踪控制
在本文中,我们将自动构建课程计划的最新算法与大规模并行仿真中的强化学习相结合,通过改进的优化方案,使得该方法能够可靠生成待追踪的课程轨迹,从而实现了比不利用这种结构化学习学习更快、更稳健的结果,最终的学习策略在真实系统上与最优控制相媲美,展
→
PDF
9 months ago
重播对于课程体系整合的影响:对于连续学习的影响
本文旨在探讨不同课程与回放方法相结合对于持续学习的影响,研究表明课程设计的三个方面有效地缓解了灾难性遗忘并增强了积极的知识转移。
PDF
a year ago
IJCAI
通过难度条件生成器可转移课程
该论文介绍了一种名为参数化环境响应模型(PERM)的方法,该方法可以根据学生的当前能力将环境的难度匹配到一个合适的 “接受挑战的区域”,以提高训练效率和知识传输,并且 PERM 可以在离线上进行培训,适用于学生之间的传输。
PDF
a year ago
Prev
Next