关键词linear function approximation
搜索结果 - 70
  • 线性函数逼近下离线强化学习中固有贝尔曼误差的作用
    PDF17 days ago
  • 强化学习基于能见度低环境中逃生路径生成
    PDFa month ago
  • 线性函数逼近作为计算有效的经典强化学习挑战解决方法
    PDFa month ago
  • 线性 MDPs 中具有累积赌臂反馈的近最优遗憾
    PDF2 months ago
  • 监督学习的 MRP 公式化:广义时间差异学习模型
    PDF2 months ago
  • 改进的对抗性线性混合马尔可夫决策过程算法:带有赌博反馈和未知状态转移
    PDF4 months ago
  • TD 学习与线性函数逼近的简单有限时间分析
    PDF4 months ago
  • 线性函数逼近的离策多步 TD 学习分析
    PDF4 months ago
  • ICLR有限时间分析对策略异构联合强化学习的应用
    PDF5 months ago
  • 带线性函数逼近的正则化 Q 学习
    PDF5 months ago
  • 基于奖励相关性过滤的线性离线强化学习
    PDF5 months ago
  • 应用 ODE 方法的随机逼近和强化学习在马尔可夫噪音中
    PDF6 months ago
  • 在连续状态 - 动作空间中驯服 “数据饥饿” 的强化学习稳定性
    PDF6 months ago
  • 安全的即时约束强化学习:激进探索的作用
    PDF6 months ago
  • TD (0) 函数逼近的集中界
    PDF7 months ago
  • 具有延迟反馈的后验抽样用于线性函数逼近的强化学习
    PDF8 months ago
  • 多批次强化学习中的样本效率:对维度相关适应性的需求
    PDF9 months ago
  • 使用线性函数逼近的 $Q$- 学习收敛的多贝尔曼算子
    PDF9 months ago
  • Q-learning 设计与乐观性的稳定性
    PDFa year ago
  • 使用函数逼近解决强化学习中重尾奖励问题:极小最优和实例相关遗憾界
    PDFa year ago
Prev