Jan, 2023

生命周期强化学习中的可扩展和鲁棒计划的最小价值等价部分模型

TL;DR本文提出了新的模型,称为 “最小价值等效部分模型”,它只对环境的相关方面进行建模。通过实验证明,基于此类模型的规划方法具有可伸缩性和鲁棒性。