Mar, 2019

基于深层次层次强化学习的多目标抽象推荐

TL;DR该论文提出一种基于分层强化学习的推荐框架,其中高层代理获取长期稀疏的转化信号并设置抽象目标,而低层代理根据抽象目标与实时环境交互,提出了多目标抽象的深层分层强化学习算法并验证其有效性。