关键词asymptotic convergence
搜索结果 - 22
  • 基于状态分离的 SARSA:一种具有恢复奖励的实用顺序决策算法
    PDF4 months ago
  • 扩散概率模型的渐进均方误差最优性
    PDF4 months ago
  • 用梯度下降学习联想记忆
    PDF4 months ago
  • 关于联邦学习中叛变影响及其预防措施
    PDF7 months ago
  • 遗憾匹配算法在博弈中的最后迭代收敛性质
    PDF8 months ago
  • ADAM 在非凸背景下的常数步长收敛性:一个简单的证明
    PDF10 months ago
  • 随机串行二次优化的迭代和乘子的几乎必然收敛
    PDFa year ago
  • 利用二阶 Poincaré 不等式对高斯神经网络进行非渐近逼近
    PDFa year ago
  • ICML强化学习的鲁棒性策略梯度方法
    PDF2 years ago
  • ICLR面向领域的对抗性训练:博弈视角
    PDF2 years ago
  • CD-split 和 HPD-split:高维度有效的共形区域分割
    PDF4 years ago
  • ICLR预测编码近似计算任意计算图上的反向传播
    PDF4 years ago
  • 近端梯度时序差分学习:具有多项式样本复杂度的稳定强化学习
    PDF4 years ago
  • tfp.mcmc: 为现代硬件构建的现代马尔可夫链蒙特卡洛工具
    PDF4 years ago
  • 无梯度的零阶方法高效避免鞍点
    PDF5 years ago
  • 非凸随机优化中动量与异步加速权衡的研究
    PDF6 years ago
  • 使用随机傅里叶特征在 RKH 空间中进行网络分布式在线学习
    PDF7 years ago
  • 随机梯度朗逊动力学的非凸学习:非渐近分析
    PDF7 years ago
  • NEXT: 网内非凸优化
    PDF8 years ago
  • AAAI深度神经网络的预条件随机梯度 Langevin 动力学
    PDF9 years ago
Prev