使用被动 Langevin 动态的自适应逆强化学习的有限样本界

Apr, 2023

使用被动 Langevin 动态的自适应逆强化学习的有限样本界

Finite-Sample Bounds for Adaptive Inverse Reinforcement Learning using Passive Langevin Dynamics

Luke Snow, Vikram Krishnamurthy

TL;DR本文提供了一种用于反向学习的被动随机梯度 Langevin 动力学 (PSGLD) 算法的有限样本分析，并提供了 2-Wasserstein 距离的有限时间界限来衡量算法和基于前向学习的随机梯度算法之间的性能。

Abstract

stochastic gradient langevin dynamics (SGLD) are a useful methodology for sampling from probability distributions. This paper provides a finite sample analysis of a passive stochastic gradient langevin dynamics a

stochastic gradient langevin dynamics passive algorithm inverse reinforcement learning finite sample analysis wasserstein distance

发现论文，激发创造

随机梯度朗逊动力学的非凸学习：非渐近分析

使用加权运输成本不等式来量化 SGLD 在欧几里得 2 - 瓦瑟斯坦距离下收敛到随机分布的速率，并在非凸学习问题的背景下提供有限时间保证来找到两种风险的近似最小化器。

Feb, 2017

随机梯度 Langevin 动力学的优缺点

本文研究了基于大规模数据集的贝叶斯学习的关键 MCMC 算法，发现当前常用的 SGLD 算法存在问题，但通过引入控制变量后的 SGLD Fixed Point 算法可以有效改善该问题，且与 Langevin Monte Carlo 算法计算成本相比更低，可为该类应用提供参考。

Nov, 2018

神经网络的自然 Langevin 动力学

在机器学习中，使用贝叶斯后验概率分布作为模型参数可以避免过度拟合，Stochastic gradient Langevin dynamics (SGLD) 是一种近似贝叶斯后验概率分布的算法，使用易于计算的 Fisher 矩阵近似，使用 Fisher 矩阵预处理可以用于大型神经网络中，并将 SGLD 与 dropout 类似的正则化技术相结合以减少过拟合。

Dec, 2017

低精度随机梯度 Langevin 动力学

本文研究了低精度随机梯度 Langevin 动力学（SGLD）和其量化方法在深度学习中的应用，发现低精度梯度累积器通过新开发的量化函数可以实现较少的成本和可比的性能。

Jun, 2022

实际中的可扩展自然梯度 Langevin 动力学

本文比较了不同的预处理方法以规范噪声向量，从混合时间、正则化效果、协变量漂移检测和对抗样本抗干扰性等方面对其进行了评估。

Jun, 2018

随机梯度 Langevin 动力学的碰撞时间分析

本文研究了随机梯度 Langevin 动力学（SGLD）算法，针对非凸优化问题，注入适当缩放的高斯噪声来更新参数，我们分析了算法达到参数空间任意子集的的命中时间，从理论上得出结论：对于经验风险最小化，如果经验风险在点值上接近于（平滑的）总体风险，则该算法在多项式时间内实现了总体风险的近似局部最小值，逃离仅存在于经验风险的次优局部最小值。同时，我们还展示了 SGLD 如何改进学习零一损失下线性分类器的已知最佳学习结果之一。

Feb, 2017

多峰分布模拟的轮廓随机梯度 Langevin 动力学算法

本论文提出了一种称为轮廓随机梯度 Langevin 动力学（CSGLD）的自适应加权随机梯度 Langevin 动力学算法，用于 Bayesian 学习在大数据的统计学中。该算法在多模态分布的模拟中具有很大的优势，并测试了 CIFAR10 和 CIFAR100 的性能。

Oct, 2020

非对数凹采样的随机梯度 Langevin 动力学的更快收敛

本文提供一种新的收敛分析方法，使用辅助的时间可逆 Markov 链来分析随机梯度 Langevin 动力学（SGLD）对一类难以 log-concave 优化分布进行采样的效果。在目标分布的一定条件下，我们证明了 SGLD 的收敛速度优于过去的研究成果，并提供了一些关于 Langevin 算法收敛和快速随机梯度采样算法设计方面的新思路。

Oct, 2020

随机梯度 Langevin 扩散中的子采样误差

在理想版本的 SGLD 之下，该文分析了 SGLD 的纯子采样误差，并将其视为扩散子采样 MCMC 方法的最佳情况下的误差。作者引入和研究了一种连续时间马尔可夫过程 SGLDiff，它在指数等待时间后随数据子集转移，并展示了后验分布与 SGLDiff 极限分布之间的 Wasserstein 距离上限。

May, 2023

通过 Langevin 动力学和生成式先验实现可证明的压缩感知

本文研究了在压缩感知中使用深度生成模型以及通过随机梯度 Langevin 动力学方法实现收敛的性质，并证明了该方法的实验性能与标准的梯度下降方法相当。

Feb, 2021