关键词fitted q-iteration
搜索结果 - 6
  • 切换损失减少批处理强化学习成本
    PDF4 months ago
  • 关于使用双层神经网络参数化的 Fitted Q-Iteration 的全球收敛性
    PDF2 years ago
  • 通过可微函数逼近离线强化学习的有效性能得到保证
    PDF2 years ago
  • 离线强化学习遗憾的快速速率
    PDF3 years ago
  • 批量强化学习中的 Q * 逼近算法:一个理论比较
    PDF4 years ago
  • 关于价值函数和智能体 - 环境边界
    PDF5 years ago
Prev
Next