BriefGPT.xyz
Ask
alpha
关键词
adversarial imitation learning
搜索结果 - 21
鉴别器 - 演员 - 评论家:解决对抗性模仿学习中样本低效和奖励倾向的问题
使用新算法 “Discriminator-Actor-Critic”,提出解决基于 Adversarial Imitation Learning 框架的两个问题:隐式偏差和与环境产生大量交互所需的复杂性。该算法使用离线策略强化学习来降低策略
→
PDF
6 years ago
Prev
Next