关键词global convergence
搜索结果 - 67
  • 非可分数据和大步长情况下的逻辑回归梯度下降
    PDFa month ago
  • 多智能体系统中独立学习的近似全局收敛性
    PDFa month ago
  • 缩小差距:在具有神经网络参数化的马尔可夫抽样下实现演员 - 评论员的全球收敛(最新迭代)
    PDF2 months ago
  • EMC$^2$: 高效的 MCMC 负采样对比学习与全局收敛性
    PDF3 months ago
  • 去中心化随机次梯度法用于非光滑非凸优化
    PDF4 months ago
  • 神经网络训练中的并行信任区域方法:超越传统方法
    PDF6 months ago
  • 联邦自然策略梯度方法用于多任务强化学习
    PDF8 months ago
  • 波兰空间中熵正则化的马尔可夫决策过程的费歇 - 劳梯度流
    PDF9 months ago
  • 无限时标平均奖励马尔可夫决策过程中策略梯度算法的遗憾分析
    PDF10 months ago
  • 一种带自适应动量的加速分块近端框架用于非凸非光滑优化
    PDF10 months ago
  • 分布式黎曼共轭梯度法在斯蒂芬尔流形上的应用
    PDF10 months ago
  • 梯度是你所需要的一切?
    PDFa year ago
  • 一种用于混杂 POMDP 的策略梯度方法
    PDFa year ago
  • 用于求解偏微分方程的 Deep Galerkin 和 PINNs 方法的全局收敛性
    PDFa year ago
  • MM改进的 (方差减少的) 策略梯度和自然策略梯度方法分析
    PDF2 years ago
  • FedFOR: 无状态异构联邦学习与一阶正则化
    PDF2 years ago
  • 多项式网络完全正确性验证
    PDF2 years ago
  • 自然策略梯度原始 - 对偶方法在约束 MDPs 上的收敛性和样本复杂度
    PDF2 years ago
  • AAAI基于策略的原始对偶法用于凸约束马尔可夫决策过程
    PDF2 years ago
  • 均场极限下带有熵正则化的 MDPs 策略梯度与神经网络逼近的收敛性
    PDF2 years ago
Prev