May, 2023

继承-前继内在探索

TL;DR本篇论文提出了Successor-Predecessor Intrinsic Exploration (SPIE)算法,并将其应用于深度强化学习代理中,展示了在稀疏奖励和瓶颈状态下,相对于其它算法,SPIE能够产生更具效率和更符合生态的探索行为,并取得更强的实证效果。