Feb, 2023

资产折旧下的强化学习

TL;DR本文提出了一种考虑资产价值随时间衰减的强化学习方案,通过资产折旧观念、贝尔曼方程等理论,提出了一种模型无关的学习方法来获得最优策略。