- 每轮只需 1 个投影的通用在线凸优化
通过黑匣子减少,我们使用简化域上定义的替代损失函数,构建了一种只需要进行一次投影的通用 OCO 算法,对于一轮在线问题,我们维护每种类型函数的一组专家,并通过元算法聚合他们的预测。我们的方法的关键在于针对强凸函数设计的专家损失函数,并通过创 - 优化平滑函数所需的比较
通过比较查询来优化光滑函数的最佳方法,无需求导方法和梯度计算。
- 偏见自适应随机逼近的非渐近分析
本研究通过非渐进性分析,探讨具有偏倚梯度和自适应步长的随机梯度下降算法,包括时间依赖的偏倚和梯度估计器的均方误差控制,结果表明带偏倚梯度的 Adagrad 和 RMSProp 算法收敛速率与无偏情况下的结果相似,实验结果进一步验证了收敛性, - 优化的十个新基准
本研究介绍了十个具有不同特性(包括噪声、不连续性、参数估计和未知路径)的新基准,用于测试新优化算法及其变种以评估其性能。
- GloptiNets:带证书的可扩展非凸优化
通过利用目标函数傅里叶频谱在衰减方面的本质,我们提出了一种新颖的具有证书的非凸优化方法,该方法处理超立方体或环面上的平滑函数。
- 实用锐度感知优化无法完全收敛至最优点
研究了具有实际配置的确定性 / 随机 Sharpness-Aware 最小化(SAM)的收敛性质,并发现它们与使用衰减扰动大小或在 yt 中使用梯度归一化的 SAM 版本的特征明显不同。
- 带量化预处理器的通信高效分布式优化
研究了通信高效算法用于强凸平滑函数最小化问题,设计了预处理梯度下降算法和牛顿方法的通信高效分布式变体,并且实验证明这些方法具有快速收敛和降低的通信复杂度。
- 通过核函数逼近寻找全局最小值
本文探讨了一种基于函数评估的平滑函数全局最小化方法,通过使用无穷次平方平滑函数之和联合建模函数以逼近并寻找全局最小值,在时间多项式子采样的情况下,该方法的计算复杂性为 $O (n^{3.5})$,空间复杂性为 $O (n^2)$,并可以实现 - 强凸平滑函数动态遗憾的改进分析
本文介绍了一种改进的 OMGD 算法动态遗憾值分析方法,证明了在一般的环境非静态情况下,该算法的遗憾值可以达到最好的三种保证之一,比以前的结果更紧凑。
- 理性神经网络
本文探讨了神经网络中的有理激活函数,证明了有理神经网络比指数小的深度下的 ReLU 神经网络更高效地逼近光滑函数,并通过数值实验证明了有理激活函数的灵活性和平滑性使其成为 ReLU 的有吸引力的替代选择。
- 光滑函数的深度网络逼近
本文研究了深度修正线性单元网络关于宽度和深度同时逼近平滑函数的最优逼近误差特性,并且证明了多元多项式可以被宽度为 O(N)和深度为 O(L)的深 ReLUNetwork 逼近,而且证明了具有 O(N lnN)宽度和 O(L lnL)深度的深 - 一种用于非光滑复合势函数的高效取样算法
本文提出了一种基于 Metropolis-Hastings 框架的新算法,用于采样具有复合非平滑密度的分布,并针对这种新算法证明了在至多 $O (d log (d/ε))$ 次迭代内将混合到距目标密度不超过 Eps 的总变差距离,而该方法的 - MM异构数据本地 GD 初步分析
本文首次对局部梯度下降进行收敛性分析,用于平滑和凸但任意函数的平均值最小化问题,在联邦学习中涉及隐私数据和异构性。我们证明在低精度情况下,该方法的通信复杂度与梯度下降相同。
- 平滑极小极大优化的高效算法
本文研究解决平滑最小最大优化问题的一阶方法,其中 g (x,y) 是平滑的且 g (x,・) 对于每个 x 均为凹性。对于 g (・,y),我们考虑两种情况 —— 强凸性和非凸性 —— 并在两种情况下改进了已知最佳速率。
- 通过更快的量子梯度计算来优化量子优化算法
该论文提出了一个基于梯度下降的优化算法框架,发展了一种计算多元实值函数梯度的量子算法,并提高了计算梯度的复杂性以适应光滑函数的重要类别,而且可以为量子最优化算法提供更快的计算梯度方法。
- 解凸二层优化问题的一阶方法
本文研究凸双层优化问题,其中内层最小化平滑函数和非凸函数的和,外层旨在在内层问题的最优解集合上最小化平滑且强凸的函数。我们分析了一个基于现有不动点算法的一阶方法,通过内部目标函数值建立了方法的全局次线性收敛率。
- MixedGrad: 一种 O (1/T) 收敛率算法用于随机平滑优化
本文将提出一种新的混合优化方法用于平滑函数优化的同时,考虑了随机预测和完整梯度的优化,通过最多使用 O (lnT) 次完整梯度 oracle 和 O (T) 次随机 oracle,可以实现 O (1/T) 的优化误差。
- 平滑函数数值积分中的维度诅咒 II
该研究证明了在平滑 d 元函数,数值积分的最坏情况下发生维数灾难,证明了无限可微函数的后继导数越大,则维数灾难越明显,利用体积估计方法证明了 n 个点所构成凸包的邻域衰减速度指数级相关于维数和点的数量关系,对无限可微函数的拟多项式、弱可处理 - 用于最小化复合函数的近端牛顿型方法
该研究广义化了牛顿型方法以处理光滑函数的最小化,特别是一个包含简单近端映射的凸函数和一个非光滑函数的总和,在此基础上提出了近端牛顿型方法。研究表明,该方法即使在计算搜索方向不精确时,也能继承用于最小化光滑函数的牛顿型方法的理想收敛性质。该方 - 快速交替线性化方法求解两个凸函数的和的最小化
本文提出了基于交替方向增广 Lagrange 方法的一阶交替线性化算法,该算法可以最小化两个凸函数的和,并给出了两种算法实现方法。实验结果验证了该算法的理论收敛性和实际应用潜力。