Jan, 2024

基于奖励相关性过滤的线性离线强化学习

TL;DR这篇论文研究了离线强化学习中带有判决论但非估计稀疏性的线性函数逼近。