Dec, 2021

一种用于PAC组合纯探索的快速算法

TL;DR本文提出了一种新的在PAC设置下求解组合型纯探索问题的算法,其计算负担较小,可适用于拥有成千上万个手臂的问题,通过逐步准许手臂并基于问题的组合结构进行消除,以及少量的组合预言调用,提供了样本复杂性保证,并在实验中证明了在大型问题上的实用性。