Nov, 2023

基于学习的线性二次高斯控制附加勘探的遗憾分析

TL;DR通过数值模拟,我们分析了一种称为 LQG-NAIVE 的方法在控制未知部分可观察系统时产生的后悔效应,提出了扩展到 “闭环” 设置的 LQG-IF2E 方法,并验证了其与 LQG-NAIVE 的竞争性能。