Mar, 2018

一种带半匪掷反馈的更好的资源分配算法

TL;DR研究了固定数量的臂之间的序列资源分配问题,提出了一种算法并证明了 O(log n)的后悔上限,同时证明了这个上限是紧密的。该算法优于以前的算法,并且关注的关键是资源分配和成功率。