Feb, 2023

学习操纵承诺优化器

TL;DR通过交互式查询领导者的最优承诺行为,研究表明,在缺乏信息优势的情况下,追随者可以在多项式时间内学习最优操纵方式。