关键词policy approximation
搜索结果 - 3
  • IJCAI通过学习队友模型实现的分散 MCTS
    PDF4 years ago
  • 原始 - 对偶 π 学习:对遍历式马尔可夫决策问题的样本复杂度和亚线性运行时间
    PDF7 years ago
  • 通过信念压缩寻找近似的 POMDP 解决方案
    PDF13 years ago
Prev
Next