Nov, 2022

模仿学习:清晰的实现

TL;DR该研究提供了基于 PyTorch 的开源模型实现,包括三个逆强化学习算法、三个模仿学习算法和一个偏好比较算法,并使用模块化的实现方式使算法开发变得简单。通过自动化测试覆盖了 98% 的代码并已对以前的结果进行基准测试。