Jul, 2020

线性赌博机探索的游戏化

TL;DR研究了线性随机机器人中的最佳臂标识,在标准多胳臂机器人中存在渐近最优算法,但是对于线性机器人中的最佳臂识别还没有出现这样的算法,本文提出了一种渐近最优算法。