Nov, 2019

带有对抗训练的模型强化学习在在线推荐中的应用

TL;DR本篇论文提出了一种基于模型的强化学习解决方案,使用生成对抗网络对用户代理交互进行建模,实现了离线策略学习。理论分析和实证评估证明了该解决方案在从离线和生成数据学习策略方面的有效性。