机器学习的新优化方法

Oct, 2015

New Optimisation Methods for Machine Learning

Aaron Defazio

TL;DR介绍了优化机器学习问题的几种新方法，包括针对有限和图结构目标的优化方法，其中包括针对固定结构的参数学习、结构学习和同时学习等方法。

Abstract

A thesis submitted for the degree of Doctor of Philosophy of The Australian National University. In this work we introduce several new optimisation methods for problems in machine learning. Our algorithms broadly fall into two categories: optimisation of →

optimization methods machine learning finite sums graph structured objectives structure learning

发现论文，激发创造

一种简单实用的有限和加速方法

该研究提出了一种针对小批量优化问题的新优化方法 SAGA，通过引入一种步长参数，在强凸光滑问题上获得了加速收敛率，同时应用于分割算子方法难以解决的许多领域。

Feb, 2016

结构化均场目标的优化

该研究论文探讨了在图形模型中计算目标函数和梯度的复杂度，发现选择具有特定图形属性的可计算子图可实现很快的块升级协调算法，并提出了一种基于辅助指数族的算法来应对其他情况，这两种算法在实证中进行了比较。

May, 2012

基于方差减少的随机优化算法在具有有限和结构的无限数据集上的应用

本文提出了针对复合目标强凸的情况下，带有方差约束的随机梯度下降法，其收敛速度优于传统的随机梯度下降法，同时常数因子也更小，只与输入数据的方差有关。

Oct, 2016

增量主次优化在大规模机器学习中的应用

提出了一种增量主化极小化算法，用于最小化连续函数的大量和，研究给出了非凸优化的渐近稳定点保证，并针对凸优化提供了期望目标函数值的收敛速度，在实验中展示了该方法在解决机器学习问题方面的竞争力以及处理非凸性惩罚稀疏估计的实用性。

Feb, 2014

有限和优化问题的下限复杂度：结果与构造

本文研究了有限和优化问题的下限复杂度界限，并基于分组的新方法构造了硬实例，从而建立了有限和最大最小优化问题的下限复杂度界限。

Mar, 2021

Finito: 一种更快速、具有置换性的渐进梯度方法，用于大数据问题

本文通过优化理论，针对平滑且强凸的有限和问题，提出一种新的求解方法，其理论收敛速度是现有方法的 4 倍，同时还可以实现不重复的抽样，提高计算速度，并通过实证研究已达到了最优表现。

Jul, 2014

功能图模型：结构支持离线数据驱动优化

研究了机器学习模型在数据驱动的优化问题中的应用以及引入的函数图模型对数据驱动优化的理论支持和实践方法。

Jan, 2024

MAST：模型无关稀疏化训练

引入了一种新的优化问题形式，与传统的最小化机器学习模型损失的黑盒函数的方式不同。通过明确地纳入最初预训练模型和随机草图运算符，允许在训练过程中对模型和梯度进行稀疏化。本研究提出的目标函数具有深刻的性质，并强调其与标准算法的联系。同时，还介绍了几种适应新问题形式的随机梯度下降（SGD）方法的变种，包括具有一般抽样的 SGD、分布式版本和具有方差减小技术的 SGD。通过这种面向稀疏化的优化方法，实现了更紧凑的收敛速度和放松了假设，填补了理论原则与实际应用之间的差距，涵盖了 Dropout 和稀疏训练等几种重要技术。该研究为通过稀疏化感知的优化方法增强对模型训练的理论理解提供了有希望的机会。

Nov, 2023

神经网络优化和泛化

论文旨在通过提出基于结构的一阶优化算法和网络集合与个体网络之间的一种新对应关系，发展人工神经网络的学习权优化和泛化理论基础，进而在具有远远更多参数的网络中探索正则化的作用。

Oct, 2022

随机平均梯度下降法最小化有限和

本文提出了基于随机平均梯度方法的优化算法，它克服了黑匣子随机梯度方法的缺点，具有更快的收敛速度和更少的梯度评估数量。实验表明，该算法在许多情况下都优于现有的随机梯度方法和确定性梯度方法，并且可以通过非均匀采样策略进一步提高表现。

Sep, 2013