Jul, 2022

BCRLSP:一种用于序列目标推广的离线强化学习框架

TL;DR该研究使用离线强化学习模型,针对真实商业环境中的预算限制进行有序定向促销,最大化用户保留率并控制现金奖励成本,在线离线实验验证表明,该方法在长期保留客户方面比基线方法表现更好、成本更低。