Aug, 2023

带有侧观测的随机图赌博学习

TL;DR提出一种算法来解决具有图反馈和一般函数空间的随机情境赌博问题,该算法适应底层图结构和奖励差距,为这种随机情境设定提供了一个依赖于差距的上界,改进了遗留问题,并通过数值实验验证了计算效率和 regret 上界的有效性,推动了具有图反馈的随机情境赌博领域的发展。