BriefGPT.xyz
Ask
alpha
关键词
cnn-airl
搜索结果 - 1
NIPS
视频游戏的逆强化学习
通过改良强化学习反求解奖励函数模型的 CNN-AIRL 方法以及使用对电子游戏环境进行了调整的自动编码器将专家演示转化为奖励网络的输入,本文在简单的 Catcher 游戏上取得了高水平表现,显著超越了 CNN-AIRL 基线,但在 Endu
→
PDF
6 years ago
Prev
Next