Jan, 2023

基于深度拉普拉斯选项的时间扩展探索

TL;DR本文提出一种基于图拉普拉斯算子的在线深度强化学习算法,用于生成探索选项,通过在基于像素的任务中的比较,证明了该算法的有效性、通用性和非静态环境下的优越性。