关键词finite-time analysis
搜索结果 - 11
- ICML分布式非光滑非凸随机优化的一阶和零阶在线优化视角PDFa month ago
- 软 Q 学习的有限时间误差分析:切换系统方法PDF4 months ago
- 异步 Q 学习在控制理论视角下的有限时间分析(随着步长逐渐缩小)PDF2 years ago
- 两个时间尺度演员评论家方法的有限时间分析PDF4 years ago
- 线性二时间尺度随机逼近在马尔可夫噪声下的有限时间分析PDF4 years ago
- 基于神经网络函数逼近的 Q 学习的有限时间分析PDF5 years ago
- 多目标同时乐观优化PDF8 years ago
- Kullback-Leibler 序贝叶斯算法的优化序列分配上界PDF12 years ago
- 汤普森抽样:渐进最优的有限时间分析PDF12 years ago
- Kullback-Leibler Divergences 下多臂老虎机问题的有限时间分析PDF13 years ago
- 有界随机赌博机及其扩展的 KL-UCB 算法PDF13 years ago
Prev
Next