BriefGPT.xyz
Aug, 2019
强化学习行为套件
Behaviour Suite for Reinforcement Learning
HTML
PDF
Ian Osband, Yotam Doron, Matteo Hessel, John Aslanides, Eren Sezener...
TL;DR
介绍用于强化学习的行为套件——bsuite,它是一系列经过精心设计的实验,目的在于收集和研究能够捕捉通用和高效学习算法设计核心问题的清晰、有信息量和可扩展的问题,以及通过这些共享基准测试评估代理人行为,这一库使用 Python 编写,容易嵌入现有项目,并通过 github.com/deepmind/bsuite开源。
Abstract
This paper introduces the
behaviour suite for reinforcement learning
, or
bsuite
for short.
bsuite
is a collection of carefully-designed ex
→