Sep, 2023

利用鞍点边界来改进随机线性赌臂算法的新算法

TL;DR我们提出了一种改进的算法,可保证在最坏情况下减少后悔,以解决随机线性强盗问题。