BriefGPT.xyz
大模型
Ask
alpha
关键词
rl task
搜索结果 - 2
强化学习任务状态对应关系的学习,用于知识迁移
该研究提出了一种基于生成对抗网络模型的一对一转移学习方法,旨在解决深度强化学习中新任务的知识重用和泛化问题。
PDF
2 years ago
ICLR
通过非对称自对弈实现内在动机和自动课程学习
通过提出动态协同(Alice 和 Bob)的兴趣课程,使用一种适当的奖励机制,有效地进行无人监督的强化学习,用于环境感知系统中的智能体的训练
PDF
7 years ago
Prev
Next