BriefGPT.xyz
Ask
alpha
关键词
entropy-regularization
搜索结果 - 2
均场 Langevin 动力学的收敛性:时间和空间离散化、随机梯度和方差缩减
本文提出了一个新的框架来证明具有有限粒子逼近,时间离散化和随机梯度逼近误差的 MFLD 的混沌传播具有时间一致性,并在学习问题和不同梯度估计器的广泛范围内建立了量化的收敛速率保证,包括 SGD 和 SVRG 算法。
PDF
a year ago
通过熵正则化的深度强化学习近似求解均场博弈
本文研究了离散时间有限 MFG 问题,通过使用熵正则化和 Boltzmann 策略使得固定点迭代收敛到近似固定点,同时提供了在高维场景下使用的近似 Nash 均衡算法以及结合虚拟博弈的深度强化学习方法。
PDF
3 years ago
Prev
Next