BriefGPT.xyz
Jul, 2020
线性赌博机探索的游戏化
Gamification of Pure Exploration for Linear Bandits
HTML
PDF
Rémy Degenne, Pierre Ménard, Xuedong Shang, Michal Valko
TL;DR
研究了线性随机机器人中的最佳臂标识,在标准多胳臂机器人中存在渐近最优算法,但是对于线性机器人中的最佳臂识别还没有出现这样的算法,本文提出了一种渐近最优算法。
Abstract
We investigate an active pure-exploration setting, that includes
best-arm identification
, in the context of
linear stochastic bandits
. While asymptotically optimal algorithms exist for standard multi-arm bandits,
→