Jun, 2023

高维情境臂材料问题无需稀疏

TL;DR研究高维线性情境赌博问题,提出了探索后承诺(EtC)算法和自适应探索后承诺(AEtC)算法,通过分析表明这些算法可以在探索和利用之间找到最佳平衡,最终对算法的性能进行了评估。