Jun, 2024

基于内在动机反馈图的强化学习在缺货库存控制中的应用

TL;DR提出了一种将强化学习与反馈图和内在动机探索相结合的决策框架,以提高应用强化学习在库存控制中的样本效率。