关键词finite-time analysis
搜索结果 - 11
  • ICML分布式非光滑非凸随机优化的一阶和零阶在线优化视角
    PDFa month ago
  • 软 Q 学习的有限时间误差分析:切换系统方法
    PDF4 months ago
  • 异步 Q 学习在控制理论视角下的有限时间分析(随着步长逐渐缩小)
    PDF2 years ago
  • 两个时间尺度演员评论家方法的有限时间分析
    PDF4 years ago
  • 线性二时间尺度随机逼近在马尔可夫噪声下的有限时间分析
    PDF4 years ago
  • 基于神经网络函数逼近的 Q 学习的有限时间分析
    PDF5 years ago
  • 多目标同时乐观优化
    PDF8 years ago
  • Kullback-Leibler 序贝叶斯算法的优化序列分配上界
    PDF12 years ago
  • 汤普森抽样:渐进最优的有限时间分析
    PDF12 years ago
  • Kullback-Leibler Divergences 下多臂老虎机问题的有限时间分析
    PDF13 years ago
  • 有界随机赌博机及其扩展的 KL-UCB 算法
    PDF13 years ago
Prev
Next