BriefGPT.xyz
Ask
alpha
关键词
rare policy switches
搜索结果 - 1
广义线性背景臂机情境下的有限适应度最优遗憾
我们在有限适应性的条件下研究广义线性情境赌博问题。我们提出了两种算法分别解决两种普遍存在的有限适应性模型:具有随机情境的批量学习和具有对抗情境的罕见策略切换。对于这些模型,我们建立了本质上紧密的遗憾上界。值得注意的是,在我们获得的上界中,我
→
PDF
3 months ago
Prev
Next