Sep, 2021
离线强化学习在实时竞价和推荐中的加速应用:模拟的潜在应用
Accelerating Offline Reinforcement Learning Application in Real-Time Bidding and Recommendation: Potential Use of Simulation
Haruka Kiyohara, Kosuke Kawakami, Yuta Saito
TL;DR利用模拟来加速离线强化学习与行动评估的实证研究:探讨离线强化学习与行动评估的实证研究如何受益于模拟,并提供了在 RecSys 和 RTB 中进一步促进实证研究的开放挑战和解决方案。