关键词finite-horizon
搜索结果 - 5
  • 离线强化学习中的选择性不确定性传播
    PDFa year ago
  • 计算有限时间赌博机的经典指标
    PDF2 years ago
  • 零和马尔可夫博弈中通用的函数逼近
    PDF3 years ago
  • 针对折扣设置的 Wang-Foster-Kakade 下限变形
    PDF4 years ago
  • 参考优势分解下几乎最优无模型强化学习
    PDF4 years ago
Prev
Next