Jun, 2017

带有固定置信度的结构化最佳臂识别

TL;DR该论文研究了在固定置信度情况下,通过从多个嘈杂的微观可观测变量映射中获得价值信息来识别最佳行动的问题,并针对这个问题引入了一个抽象框架,提出了一种新的算法(LUCB-micro),同时分析了其下界和上界样本复杂性的结果。