ICMLMay, 2022

对抗式多臂老虎机的在线元学习

TL;DR研究使用元学习算法解决敌对多臂赌博机问题,在每个 episode 中利用经验分布提高算法性能,并得到了针对该问题的最小遗憾界。