Jun, 2023

面向离线强化学习的价值感知重要性加权

TL;DR本文提出了一种基于价值感知的重要性权重方法,可用于增强学习的离线预测模型,并在实验中进行了评估。