Feb, 2024

无模型 μ- 综合:一种非光滑优化视角

TL;DR我们论文通过对两种模型无关策略优化策略(非导数抽样方法和零阶策略搜索与均匀平滑)的有效性进行了研究,扩展了以模型为基础的子梯度策略优化方法到模型无关设置,并通过广泛的数值研究证明了这两种方法能够一致地复制其模型为基础的对应方法所实现的设计结果。此外,我们还提供了一些理论证明,表明在与成本函数的协调性有关的某些假设下,可以建立起从站点的收敛性保证。总体而言,我们的结果表明,无导数策略优化提供了一种在模型无关设置下解决一般输出反馈下的 μ 综合问题的竞争性和可行性方法。