使用示范加速强化学习和规划：一项调查

Mar, 2023

使用示范加速强化学习和规划：一项调查

Boosting Reinforcement Learning and Planning with Demonstrations: A Survey

Tongzhou Mu, Hao Su

TL;DR本综述介绍了在复杂环境下采用启发式专家经验演示来加速强化学习决策的优点，讨论了演示在决策学习中各种应用方法，并提供了一个实用的流程示例用于生成和利用演示。

Abstract

Although reinforcement learning has seen tremendous success recently, this kind of trial-and-error learning can be impractical or inefficient in complex environments. The use of →