关键词reward machine
搜索结果 - 3
  • 贝叶斯逆强化学习用于非马尔可夫奖励
    PDF16 days ago
  • 检测隐藏的触发器:将非马尔可夫奖励函数映射到马尔可夫
    PDF6 months ago
  • 在部分已知语义环境中联合学习奖励机制和策略
    PDF2 years ago
Prev
Next