BriefGPT.xyz
Ask
alpha
关键词
lq control
搜索结果 - 1
基于 Thompson Sampling 的未知线性系统学习控制
引入 Thompson 采样算法应对 LQ 控制问题的未知系统参数,该算法被称为具有动态阶段的 Thompson 采样(TSDE),其中包括两种停止准则来确定动态阶段的长度并呈现出具有 O (sqrt (T)) 的期望后悔值的性质,加入重启
→
PDF
7 years ago
Prev
Next