Jul, 2023

离线不平衡数据集的强化学习

TL;DR通过在分布式的约束条件如 onservative Q-learning 基础上引入信息检索过程,有效地减轻了失衡数据集所带来的挑战,我们提出了一种新颖的离线强化学习方法,并在不同程度失衡的数据集上的几个任务中评估了其优劣。