BriefGPT.xyz
Ask
alpha
关键词
online non-stochastic control
搜索结果 - 1
基于 FTRL 的乐观在线非随机控制
该研究论文将 “乐观主义” 概念引入在线非随机控制(NSC)的新颖框架中,研究了如何利用负责预测未来成本的未知质量的预测预报器使 NSC 受益。首先将问题简化为具有延迟反馈的乐观学习问题,并通过乐观正则化领导者(OFTRL)算法家族来解决。
→
PDF
3 months ago
Prev
Next