关键词approximate dynamic programming
搜索结果 - 12
  • 多项式时间下的受限强化学习确定性策略
    PDFa month ago
  • 能效基站小区切换自适应动态规划
    PDF9 months ago
  • 在 q^π 可实现的 MDPs 中进行自信近似策略迭代,以实现高效的本地规划
    PDF2 years ago
  • ICLR运动中的思考:深度强化学习与并发控制
    PDF4 years ago
  • 学习凸优化控制策略
    PDF5 years ago
  • AAAI基于神经网络的动态规划算法应用于顺风车拼车
    PDF5 years ago
  • AAAI深度保守策略迭代
    PDF5 years ago
  • MM近似动态规划的理论和数值分析及其近似误差
    PDF10 years ago
  • 一个适用于单调价值函数的近似动态规划算法
    PDF10 years ago
  • 分解型 MDPs 的策略迭代
    PDF11 years ago
  • 通过最小化分布健壮边界来近似动态规划
    PDF12 years ago
  • ICML基于正则化的特征选择在近似线性规划中用于 Markov 决策过程
    PDF14 years ago
Prev
Next