Oct, 2016

多目标深度强化学习

TL;DR文章提出 DOL 方法,通过使用高维输入的特征,计算包含所有潜在最优解的凸组合集,解决了高维多目标决策问题,并提供了一个包含两个实验的基准测试平台用于深度多目标强化学习。