Apr, 2018

回溯模型:高效强化学习追溯痕迹

TL;DR通过回溯模型和回溯的方式,可以在强化学习中发现更多高奖励状态,从而提高状态采样的效率。