BriefGPT.xyz
Ask
alpha
关键词
finite-time bounds
搜索结果 - 3
自回归系统外部输入下的最小方差控制的有限时间遗憾界
本文提出了一种使用探索输入的自适应最小方差控制算法 PIECE,该算法具有有限时间后的悔恨上限,并通过仿真实验证明了其在初始学习阶段具有比标准方法更优异的表现,这是首次针对最小方差控制器提出有限时间后悔上限的研究。
PDF
a year ago
线性随机逼近和 TD 学习的有限时间误差界
考虑由 Markovian 噪声驱动的线性随机逼近算法的动态特性,通过考虑适当选择的 Lyapunov 函数的漂移,获得常数步长算法的有限时间误差的二次矩的有限时间界限。我们还对逼近误差 2 范数的平方的矩进行了全面的处理。
PDF
5 years ago
非凸优化中分数阶 Langevin 蒙特卡罗的非渐近分析
研究了 Langevin Monte Carlo 算法及其扩展 Fractional Langevin Monte Carlo 在非凸优化问题中的用法和收敛性,证明了 Fractional Langevin Monte Carlo 算法的有
→
PDF
5 years ago
Prev
Next