关键词linear function approximation
搜索结果 - 70
  • 线性函数逼近 SARSA 算法的收敛性:随机时限情况
    PDFa year ago
  • ICML通用效用的强化学习:更简单的方差缩减和大状态行动空间
    PDFa year ago
  • 使用线性函数逼近进行策略评估的高概率样本复杂度
    PDFa year ago
  • 几乎没有通信的分布式 TD (0)
    PDFa year ago
  • ICML正则化和方差加权回归在线性 MDPs 中实现极小化最优性:理论和实践
    PDFa year ago
  • 基于线性函数逼近的纳什 Q 学习的有限样本保证
    PDFa year ago
  • 具有对数最坏情况遗憾的量子强化学习的可证明高效探索
    PDFa year ago
  • 组合动作空间中的高效规划及其在合作多智能体强化学习中的应用
    PDFa year ago
  • 线性函数逼近的对抗式 MDP 的精炼遗憾
    PDFa year ago
  • 线性马尔科夫决策过程的近最小值最大化强化学习
    PDF2 years ago
  • 基于线性函数逼近的无奖励强化学习中的近最优部署效率
    PDF2 years ago
  • 具有线性函数逼近的分布鲁棒离线强化学习
    PDF2 years ago
  • ICML线性函数逼近下的最小最大优化强化学习
    PDF2 years ago
  • 具有线性函数逼近的可证明高效的无模型约束强化学习
    PDF2 years ago
  • ICML使用线性结构稳定 Q 学习,以实现证明有效的学习
    PDF2 years ago
  • 线性函数逼近下的近似极小极大离线强化学习:单智能体 MDP 和马尔科夫博弈
    PDF2 years ago
  • 使用线性函数逼近的无奖励模型强化学习
    PDF3 years ago
  • 基于线性实现最优值函数的 MDP 计划的张量计划及少动作下限
    PDF3 years ago
  • MM异构电池组最优化循环的强化学习
    PDF3 years ago
  • 使用线性函数逼近实现高效的本地规划
    PDF3 years ago