Sep, 2023

绕过模拟器:近似最优的对抗线性情境赌博机

TL;DR通过实现无需模拟器的多项式时间算法,我们在拥有线性上界误差的情况下,提高了对抗性线性上下文赌博问题的表现,实现了近乎优化的后悔度,同时保持了计算效率。