Nov, 2023

SCOPE-RL:一个用于离线强化学习和离线策略评估的 Python 库

TL;DRSCOPE-RL 是一款面向离线强化学习(offline RL)、离策略评估(off-policy evaluation)和选择(selection)的全面开源 Python 软件,通过集成政策学习和评估等两个关键方面,提供了灵活和完整的离线 RL 和 OPE 过程的实现,其中特别注重 OPE 模块,提供了一系列 OPE 估计器和鲁棒的 OPE 评估协议。