NIPSNov, 2016

使用深层生成模型进行多任务强化学习的探索

TL;DR使用深度生成模型和低维能量模型辅助多任务强化学习中的探索,以便于系统识别,从而提供鲁棒且适应性强的探索信号。