ICMLJun, 2020

面向高效多通道串行广告的动态背包优化

TL;DR本研究将顺序广告策略优化建模为动态背包问题,并提出了一种具有理论保证的二层优化框架,以显著降低原始优化空间的解决方案,同时确保解决方案的质量,进一步地通过缩小行动空间提高了增强学习的探索效率。离线和在线实验表明,相比工艺水平的基线方法,我们的方法在累计收入方面表现优异。