Sep, 2023

改进样本复杂度的学习零和线性二次博弈

TL;DR我们提出了一种简化的嵌套零阶算法,通过改进样本复杂度几个数量级,并使用单点零阶估计器,在相同假设下确保了 Γ(E^3) 样本复杂度。