关键词sparse reward signals
搜索结果 - 3
  • 用于单示范模仿学习的专家接近度作为替代奖励
    PDF5 months ago
  • 自我模仿学习中基于内在动机的探索改进方法研究
    PDF2 years ago
  • 游戏中学习 —— 从零开始解决稀疏奖励任务
    PDF6 years ago
Prev
Next