BriefGPT.xyz
Ask
alpha
关键词
limited adaptivity
搜索结果 - 2
广义线性背景臂机情境下的有限适应度最优遗憾
我们在有限适应性的条件下研究广义线性情境赌博问题。我们提出了两种算法分别解决两种普遍存在的有限适应性模型:具有随机情境的批量学习和具有对抗情境的罕见策略切换。对于这些模型,我们建立了本质上紧密的遗憾上界。值得注意的是,在我们获得的上界中,我
→
PDF
3 months ago
ICML
低转移成本的多项式逻辑赌博机
研究在多项式逻辑赌博算法中探索动作改变尽可能少的限制自适应性,在实现几乎最优的极小化遗憾时,提出两种自适应性的度量:混合替换成本和更精细的项替换成本。
PDF
4 years ago
Prev
Next