Dec, 2013

度量空间中的赌徒和专家

TL;DR本文研究一种广泛适用于多臂赌博机问题的设置,其中策略构成度量空间,支付函数对度量满足Lipschitz条件,并提出了一种算法使之达到最优。