Jun, 2022

重生强化学习:重复利用过去计算以加速进展

TL;DR提出转世强化学习理论作为强化学习(RL)研究的另一种工作流程或问题类别,以便能够在设计迭代之间或不同代理之间重复使用或转移先前的计算工作(例如,学习策略); 研究关注现有子优政府的有效传输,并提出了一种简单的算法来解决其限制,最后,在 Atari 2600 游戏,挑战性的互动任务以及导航平流层气球等问题上展现了转世 RL 与 tabula rasa RL 相比的优势,证明这是一种可能提高 RL 实际应用和进一步民主化 RL 的另一种方法。