Aug, 2019

DoorGym:可扩展的开门环境和基准智能体

TL;DR该篇文章介绍了 DoorGym 环境模拟框架,利用强化学习与领域随机化提高模型泛化性能。提供的基于 PPO 和 SAC 的实现可成功地在 DoorGym 环境中打开不同类型的门,并且现实世界中的转移实验也证明了训练出的模型的可用性。