Jun, 2022

实时竞价的功能优化强化学习

TL;DR本文提出了一种多智能体强化学习架构以用于实时竞价广告,使用三个 Lagrange 乘数基于功能优化以及一个基准代理程序进行竞标环境设计。实验结果表明,相比其他代理程序,具有功能优化的代理程序在广告竞标过程中获胜速率和盈余率上有显著提升,表现出优异的表现和盈利性。