Nov, 2019

MAME:模型无关元探索

TL;DR本论文提出了一种在元强化学习中有效实现探索策略的方法,即通过建立一个单独的探索策略,通过自监督和监督学习目标来实现适应,相较于现有的方法可以更加灵活和高效地训练策略,并在实验中表现出更卓越的性能。