基于期望目标的 GO 梯度

Jan, 2019

GO Gradient for Expectation-Based Objectives

Yulai Cong, Miaoyun Zhao, Ke Bai, Lawrence Carin

TL;DR提出了一种可以应用于非可重参数化连续或离散随机变量的梯度计算方法（GO 梯度），并且具有与可重参数化方法相同的低方差，同时还开发了一种通过不同分布的传播链规则、将神经网络与常见随机变量相耦合的统计反向传播方法。

Abstract

Within many machine learning algorithms, a fundamental problem concerns efficient calculation of an unbiased gradient wrt parameters $\gammav$ for expectation-based objectives $\Ebb_{q_{\gammav} (\yv)} [f(\yv)]$. Most existing methods either (i) suffer from high variance, seeking help

machine learning gradient calculation variance reduction continuous random variables discrete random variables

发现论文，激发创造

梯度基方法在全谱游戏中的紧密一致分析

通过分析梯度方法在达到纳什均衡时的线性收敛特性，证明了变异梯度方法在双线性博弈和强单调性博弈中的各种表现，并发现了这些方法在极端情况下收敛机制的差异。同时证明了变异梯度可以在任意外推次数的情况下实现优化率，一个广泛算法类别的最佳值

Jun, 2019

Rao-Blackwell 算法优化直通 Gumbel-Softmax 梯度估计器

本研究提出了一种对 Gumbel-Softmax estimator 进行 Rao-Blackwellization 的方法，可在不增加函数评估数量的情况下减少方差，从而降低均方误差，并在两种无监督潜变量模型中得到了实证验证。

Oct, 2020

广义的重新参数化梯度

本文提出广义重参数化梯度，将此技术拓展到更大范围的变分分布，使用潜在变量的可逆变换，组合重参数化梯度和分数函数梯度得到新的 Monte Carlo 梯度，并在两个复杂的概率模型上展示了其高效性。

Oct, 2016

机器学习中的蒙特卡罗梯度估计

介绍使用 Monte Carlo 梯度估计策略解决机器学习中的梯度问题和灵敏度分析的方法和历史发展，并深入探讨了路径、分数函数和测度梯度估计器的应用、关系和可能的泛化。

Jun, 2019

混合量子经典优化的随机梯度下降

本文探索了在混合量子 - 经典优化的上下文中，利用量子硬件估计期望值所产生的随机梯度下降优化，证明了在很多相关算法，如 VQE、QAOA 和某些量子分类器中使用 $k$ 次测量结果估计期望值的优化算法的收敛性能可以得到严格的理解，本文证明了所有算法都有收敛保证，并在基准 VQE、QAOA 和量子增强机器学习任务上进行了数值探索。

Oct, 2019

关于广义光滑下多目标优化的收敛性研究

本文研究了多目标优化问题中更一般且更现实的平滑损失函数类别，在神经网络中，提出了两种新颖的单循环算法 GSMGrad 和 SGSMGrad，以逼近在所有目标之间最大化最小改进的冲突避免方向。

May, 2024

离散分布的 Rao-Blackwellized 随机梯度

本文介绍了一种 Rao-Blackwellization 技术，可用于降低任何随机梯度估计器的方差，同时保持无偏性，作者证明了该技术在半监督分类问题和像素注意力任务中的改进效果。

Oct, 2018

设计贝叶斯最优实验的统一随机梯度方法

本文提出了一种全概率梯度方法来解决贝叶斯最优实验设计的问题，该方法利用变分下界来进行预期信息增益的优化，并提供多种变分目标，最终表现出比现有方法在高维设计优化中更有效的性能。

Nov, 2019

通过健壮的梯度估计实现健壮的估计

文章提出了一种新的，计算高效的风险极小化估计器类别，展示了它们在一般统计模型中的鲁棒性，特别地，在经典的 Huber epsilon 污染模型和重尾情况下。提出的核心是一种新型的鲁棒梯度下降算法，还给出了它在一般凸风险极小化问题中提供准确估计的条件，并以线性回归、逻辑回归和指数族中的规范参数估计为例。最后，在合成和实际数据集上研究了这种方法的实证表现，发现其比多种基线方法更具说服力。

Feb, 2018

在量子硬件上计算解析梯度

本文介绍了一种利用同一或几乎相同的架构的方法来估计量子测量期望值的梯度，以优化杂化量子 - 经典算法的目标函数，尤其适用于量子化学、药物发现和机器学习等领域。

Nov, 2018