Nov, 2023

基于学习的线性二次高斯控制附加勘探的遗憾分析

TL;DR通过数值模拟,我们分析了一种称为LQG-NAIVE的方法在控制未知部分可观察系统时产生的后悔效应,提出了扩展到“闭环”设置的LQG-IF2E方法,并验证了其与LQG-NAIVE的竞争性能。