Aug, 2023
Stackelberg轨迹博弈中的主动逆向学习
Active Inverse Learning in Stackelberg Trajectory Games
TL;DR博弈论逆学习是从玩家的行动推断他们的目标的问题。我们在一场领导者与追随者的Stackelberg博弈中,将逆学习问题制定为每个玩家的行动是动力系统的轨迹。我们提出了一种主动的逆学习方法,用于领导者推断有限集候选中哪个假设描述追随者的目标函数。与现有方法不同,该方法主动地最大化了不同假设下追随者轨迹的差异,以加速领导者的推断。我们在一场时变轨迹重复博弈中演示了该方法。与均匀随机输入相比,该方法提供的领导者输入将追随者轨迹的条件下不同假设的概率收敛加速了数个数量级。