Mar, 2021

深度离线评估的基准测试

TL;DR为了推动离线学习中的评估和选择复杂政策的发展,我们提供了一套用于基准测试的数据集和策略集,旨在提供一种标准化的进展度量方式,并对现有的算法进行评估。