在线凸优化简介

Sep, 2019

Introduction to Online Convex Optimization

Elad Hazan

TL;DR本文研究将优化视为一种过程，强调学习方法的应用，提倡使用鲁棒性的算法并学习实践经验以应对实际应用中复杂环境下的问题。

Abstract

This manuscript portrays optimization as a process. In many practical applications the environment is so complex that it is infeasible to lay out a comprehensive theoretical model and use classical algorithmic theory and →

optimization process robust approach algorithmic theory mathematical optimization learning method

发现论文，激发创造

现代在线学习简介

本文介绍了在线学习的基本概念和现代在线凸优化的视角，并针对凸丢失，在欧几里得和非欧几里得环境中介绍了一阶和二阶算法。同时，还特别关注了算法参数调优和在无界域上的学习，并介绍了对非凸损失的处理方法和信息缺失的决策问题中的多臂赌博机问题。

Dec, 2019

从优化角度学习

本文分为两部分，第一部分研究了统计学习问题的可学习性和在线学习问题的泛化能力，使用稳定性和经典工具如 Rademacher 复杂度和覆盖数，发现一般学习环境下统一收敛理论无法检测可学习性，第二部分针对凸优化问题提出了适当的镜像下降更新以及 MD 算法在凸优化问题上的可行性研究，证明线性类的 fat-shattering 维度限制了预测问题的 oracle 复杂度。

Apr, 2012

凸优化：算法与复杂度

本文旨在介绍凸优化及其相应算法，包括黑盒优化，结构优化，随机优化以及非欧几里德设置下的机器学习算法。

May, 2014

使用非线性系统理论学习带有收敛保证的优化方法

我们提出了一个利用非线性系统理论填补演进中算法收敛性和鲁棒性分析的理论框架，可以自动化地优化学习到的算法，保证其设计上的收敛性。

Mar, 2024

在线凸优化的广义方法

本研究分析了在线凸优化问题在不同情境下的处理方法，并在具有完全适应性对手的在线线性优化算法为在线凸优化算法提供了一个模板，同时将需要完全信息反馈的算法转换为具有相近遗憾界限的半强盗反馈算法。此外，通过对半强盗反馈中使用确定性算法的完全适应性对手和使用随机算法的毫无意识对手进行比较，我们证明了可以在面对不可避免对手时，设计针对完全适应性对手的算法使用仅具有随机半强盗反馈也能获得类似界限。基于此，我们提出了将一阶算法转换为零阶算法，并具有相近遗憾界限的通用元算法框架。我们的框架允许在不同情境下分析在线优化，如全信息反馈、强盗反馈、随机遗憾、对手遗憾和各类非稳定遗憾。利用我们的分析，我们提供了第一个使用线性优化预言机的无投影在线凸优化算法。

Feb, 2024

将后悔换成效率：具有长期限制条件的在线凸优化

本文提出了解决约束在线凸优化问题的框架。通过将问题转化为在线凸 - 凹优化问题，提出了一种有效的算法，可以实现收敛性较好的结果。同时，本文还为从中提取多点强化信号的约束在线凸优化问题提供了解决方案。

Nov, 2011

机器学习的非凸优化

本文阐述了机器学习中的非凸优化问题和直接方法在此领域的成功应用，旨在介绍这一领域的文献和分析非凸问题的简单程序工具。

Dec, 2017

在线自适应方法、普适性和加速

本文针对凸无约束优化问题提出了一种新方法，通过一种自适应学习率规则和线性耦合两个序列的方式，利用重要权重和自适应在线学习算法的思想实现了对光滑目标、非光滑一般情况和随机优化的加速收敛。实证分析表明了本方法在上述场景中的适用性并证实了我们的理论发现。

Sep, 2018

通过在线学习实现广义逆优化

该论文提出了一种面向在线学习的反向优化算法框架，设计了一种隐式更新算法用于处理噪声数据，并证明其具有统计一致性。实验表明，该算法具有很高的精度和鲁棒性，并且在计算效率上比批量学习更具优势。

Oct, 2018

从机器学习的视角调查优化方法

本研究回顾了机器学习中优化方法的原则、进展和应用，总结了在一些流行的机器学习领域中优化方法的应用和发展，并提出了机器学习中优化的一些挑战和未解决的问题。

Jun, 2019