Oct, 2023

离散时间静态输出反馈策略梯度方法的优化景观

TL;DR静态输出反馈控制中政策梯度方法在离散时间线性时不变系统中的优化性质的分析