在线优化控制及仿射约束

Oct, 2020

Online Optimal Control with Affine Constraints

Yingying Li, Subhro Das, Na Li

TL;DR该论文研究了在线最优控制问题，提出了一种基于OGD-BZ算法的解决方案，并分析了该算法的策略遗憾问题。

Abstract

This paper considers online optimal control with affine constraints on the states and actions under linear dynamics with random disturbanc

发现论文，激发创造

动态环境下的在线优化：强凸问题改进遗憾率

本文提出一种基于在线梯度下降方法的动态调参算法，以降低动态遗憾（dynamic regret），进而优化强凸且未知动力学的损失函数。

Mar, 2016

在线线性二次控制

我们研究了控制具有已知嘈杂动力学和对抗选择二次损失的线性时不变系统的问题，并提出了第一种在这种情况下保证O（sqrt（T））遗憾的有效在线学习算法。我们的算法依赖于对系统稳态分布的新型SDP松弛。与以前提出的松弛相反，我们的SDP的可行解都对应于“强稳定”策略，这些策略混合到稳定状态的速度呈指数增长。

Jun, 2018

带敌对扰动的在线控制

本文研究带有敌对干扰的线性动态系统的控制，在几乎不知道扰动信息的情况下，实现近乎最优的在线控制过程，主要贡献是提出一种算法来提供几乎紧密的遗憾界，这一研究在技术层面上对以前的工作进行了推广和扩展。

Feb, 2019

在线控制的对数后悔

本研究中，我们研究了在线控制下的线性动态系统在拥有转移动态知识的拥有敌意的变化强凸成本函数下的最优遗憾界限，并提出了在线梯度下降和在线自然梯度两种不同且高效的迭代方法来实现遗憾边界小而有效。

Sep, 2019

在线LQR的朴素探索是最优的

在处理未知真实系统参数的在线自适应控制问题中，使用新的上下界结论证明误差的最优性跟时间步数，输入空间和系统状态空间的维度呈现为~(T*d_u^2*d_x)^1/2, 并引入自绑定ODE方法控制Riccati方程扰动，从而实现任意可控系统实例的回归上界。同时，提出对估计的系统动力学进行合成的确定性等效控制器。

Jan, 2020

对抗性在线控制的对数遗憾

本文针对已知系统且受到敌对扰动的情况下，介绍了新的在线线性二次控制算法，通过将在线控制问题转化为具有近似优越函数的（延迟的）在线学习，无需控制迭代的运动成本，从而提高了算法的效果。

Feb, 2020

线性动力学的在线控制：基于数据驱动的方法

该论文研究在线控制问题，通过使用单一无噪声轨迹计算干扰累积并通过在线梯度下降更新参数，提出了一种数据驱动的策略来减小控制器的后悔。

Aug, 2023

线性约束在线LQG问题的策略优化的遗憾分析

在线优化方法可用于研究在线线性二次型调节器问题，本研究通过在线乐观牛顿法提供了一个基于函数序列的在线控制器，并利用后悔度量定义了算法的性能界限。

Mar, 2024

具有对抗约束的在线凸优化的严格界

有关在线凸优化和约束在线凸优化的一篇研究论文，证明了一个在线策略可以同时实现 O(√T) 的遗憾和 θ̃(√T) 的累积约束违规，通过将 AdaGrad 算法的自适应遗憾界与 Lyapunov 优化相结合，达到了这一结果。

May, 2024

在线堆叠伯格优化与非线性控制

适应性代理、在线控制、后悔最小化、对抗性干扰、表现性预测是该研究论文的主要关键词，该论文提出了一个统一的算法框架，用于在预测和优化可能的代理响应空间中实现可计算的后悔最小化，同时说明了在各种情况下的的紧界限制以及应用实例。

Jun, 2024