关键词linear function approximation
搜索结果 - 70
- 线性函数逼近下离线强化学习中固有贝尔曼误差的作用PDF17 days ago
- 强化学习基于能见度低环境中逃生路径生成PDFa month ago
- 线性函数逼近作为计算有效的经典强化学习挑战解决方法PDFa month ago
- 线性 MDPs 中具有累积赌臂反馈的近最优遗憾PDF2 months ago
- 监督学习的 MRP 公式化:广义时间差异学习模型PDF2 months ago
- 改进的对抗性线性混合马尔可夫决策过程算法:带有赌博反馈和未知状态转移PDF4 months ago
- TD 学习与线性函数逼近的简单有限时间分析PDF4 months ago
- 线性函数逼近的离策多步 TD 学习分析PDF4 months ago
- ICLR有限时间分析对策略异构联合强化学习的应用PDF5 months ago
- 带线性函数逼近的正则化 Q 学习PDF5 months ago
- 基于奖励相关性过滤的线性离线强化学习PDF5 months ago
- 应用 ODE 方法的随机逼近和强化学习在马尔可夫噪音中PDF6 months ago
- 在连续状态 - 动作空间中驯服 “数据饥饿” 的强化学习稳定性PDF6 months ago
- 安全的即时约束强化学习:激进探索的作用PDF6 months ago
- TD (0) 函数逼近的集中界PDF7 months ago
- 具有延迟反馈的后验抽样用于线性函数逼近的强化学习PDF8 months ago
- 多批次强化学习中的样本效率:对维度相关适应性的需求PDF9 months ago
- 使用线性函数逼近的 $Q$- 学习收敛的多贝尔曼算子PDF9 months ago
- Q-learning 设计与乐观性的稳定性PDFa year ago
- 使用函数逼近解决强化学习中重尾奖励问题:极小最优和实例相关遗憾界PDFa year ago
Prev