Mar, 2025
纳什均衡约束的自动出价与双层强化学习
Nash Equilibrium Constrained Auto-bidding With Bi-level Reinforcement
Learning
TL;DR本研究针对现有自动出价算法未能准确捕捉在线广告平台所面临的自动出价问题,提出了一种新的自动出价问题表述——纳什均衡约束出价(NCB),旨在最大化广告商的社会福利同时满足$\epsilon$-纳什均衡约束。通过引入具有理论保证的双层策略梯度(BPG)框架,本研究克服了NCB问题的复杂性,其计算复杂度与广告商数量无关,实验验证了其有效性。