Feb, 2024

深度自回归密度网络与神经集成在基于模型的离线强化学习中的比较

TL;DR离线强化学习中,通过提供的系统转换数据进行策略优化;研究了基于模型的强化学习算法,并挖掘了模型学习的静态度量方法,以及模型错误对代理的最终性能的影响。