Aug, 2019

强化学习行为套件

TL;DR介绍用于强化学习的行为套件——bsuite,它是一系列经过精心设计的实验,目的在于收集和研究能够捕捉通用和高效学习算法设计核心问题的清晰、有信息量和可扩展的问题,以及通过这些共享基准测试评估代理人行为,这一库使用 Python 编写,容易嵌入现有项目,并通过 github.com/deepmind/bsuite开源。