关键词stochastic approximation
搜索结果 - 54
  • 学习控制未知强单调博弈
    PDF4 days ago
  • 大规模双层优化的内存高效梯度展开
    PDF14 days ago
  • 优化确定性等价风险估计的集中界
    PDFa month ago
  • ICML变分薛定谔扩散模型
    PDF2 months ago
  • DASA:延迟自适应多智能体随机逼近
    PDF3 months ago
  • 基于随机逼近的联邦机器学习方法
    PDF4 months ago
  • 具有延迟更新的随机逼近:马尔科夫采样下的有限时间收敛速率
    PDF4 months ago
  • 常步尺度 Q - 学习:分布收敛、偏差和推广
    PDF5 months ago
  • 快速非线性两时间刻度随机逼近:达到 O (1/k) 有限样本复杂度
    PDF5 months ago
  • 具有马尔科夫噪声的双时间尺度随机逼近的中心极限定理:理论与应用
    PDF6 months ago
  • 应用 ODE 方法的随机逼近和强化学习在马尔可夫噪音中
    PDF6 months ago
  • 具有马尔可夫噪声的双时间尺度线性随机逼近的紧限定时间界
    PDF6 months ago
  • 随机逼近的收敛速度:有偏差噪声与无界方差,及其应用
    PDF7 months ago
  • 基于正则化斯坦距离的神经算子变分推断用于深高斯过程
    PDF9 months ago
  • Q-learning 设计与乐观性的稳定性
    PDFa year ago
  • 具有本地超梯度估计的联邦多序列随机逼近
    PDFa year ago
  • 可分离随机逼近框架下的在线学习
    PDFa year ago
  • 强化学习教程介绍
    PDFa year ago
  • 凸多阶段随机优化的数值方法
    PDFa year ago
  • 双层优化与 Stackelberg 博弈的一阶收敛方法
    PDFa year ago
Prev