Jun, 2023

基于扰动数据源的可证明高效离线强化学习

TL;DR本文研究了使用多个数据集进行离线强化学习的问题,提出了一种考虑样本和数据源不确定性的算法,并在离线马尔科夫博弈和离线鲁棒强化学习方面进行了推广。