Sep, 2021

离线强化学习在实时竞价和推荐中的加速应用:模拟的潜在应用

TL;DR利用模拟来加速离线强化学习与行动评估的实证研究:探讨离线强化学习与行动评估的实证研究如何受益于模拟,并提供了在 RecSys 和 RTB 中进一步促进实证研究的开放挑战和解决方案。