BriefGPT.xyz
Ask
alpha
关键词
evil
搜索结果 - 1
ICML
EvIL:演化策略用于可广泛应用的模仿学习
在仿真学习中,我们通过整合奖励模型集合以及使用演化策略方法 EvIL 来提高重新训练和迁移性能,同时加速目标环境中的重新训练,在连续控制任务中比之前的工作更加高效地重新训练策略。
PDF
21 days ago
Prev
Next