Oct, 2023

重尾臂赌博机中实现全自适应遗憾最小化

TL;DR学习重尾分布下的遗憾最小化问题,引入自适应算法并提供适应性鲁棒 UCB 方法,以最小化重尾 MAB 问题的遗憾。