Oct, 2021

CORA: 连续强化学习智能体平台的基准、基线和度量标准

TL;DR本文介绍了 CORA 平台,该平台针对 Continual Reinforcement Learning 智能体提供了基准、基线和度量标准,其中基准旨在评估连续 RL 挑战的不同方面,而度量标准提供连续评估、隔离遗忘和零射前传递。同时,该平台还包括一组表现良好、开源的现有算法基线,旨在加速新 Continual Reinforcement Learning 算法的开发。