关键词stochastic approximation
搜索结果 - 54
  • 一种用于随机双层优化的全一阶方法
    PDFa year ago
  • 多分辨率在线确定性退火:一种层次和渐进式学习架构
    PDF2 years ago
  • 随机逼近渐进学习的模拟退火优化
    PDF2 years ago
  • ICML使用线性结构稳定 Q 学习,以实现证明有效的学习
    PDF2 years ago
  • 非强凸最小二乘问题的加速随机梯度下降
    PDF2 years ago
  • AAAISimSR: 一种用于深度强化学习的简单基于距离的状态表示方法
    PDF3 years ago
  • MM随机超梯度的收敛性质
    PDF4 years ago
  • 两时间尺度值基强化学习算法的样本复杂度界限
    PDF4 years ago
  • 随机梯度下降法和随机重球法的几乎必然收敛速率
    PDF4 years ago
  • 机器学习中的自动微分数学模型
    PDF4 years ago
  • MM无梯度方法求解鞍点问题
    PDF4 years ago
  • 时序差分学习是否最优?一种实例相关的分析
    PDF4 years ago
  • 蒙特卡罗和线性随机逼近的显式均方误差界
    PDF4 years ago
  • 利用平滑凸包的随机逼近的有限样本分析
    PDF4 years ago
  • 异步随机逼近与 Q 学习的有限时间分析
    PDF4 years ago
  • 非线性随机逼近的有限样本分析及其在强化学习中的应用
    PDF5 years ago
  • 平滑强凸函数的随机逼近:超越 $O (1/T)$ 收敛速度
    PDF5 years ago
  • 一种适用于嵌套随机优化的单时间尺度随机逼近方法
    PDF6 years ago
  • 非光滑随机逼近分析:微分包含方法
    PDF6 years ago
  • 黎曼流形上的随机逼近
    PDF7 years ago