Oct, 2022

分布自适应元强化学习

TL;DR本研究提出了一种元强化学习算法的框架,该框架可以适应于测试时间任务分布变化,以提高在分布转移下的领域中的适应能力和性能。