Jun, 2024
基于内在动机反馈图的强化学习在缺货库存控制中的应用
Reinforcement Learning with Intrinsically Motivated Feedback Graph for Lost-sales Inventory Control
Zifan Liu, Xinran Li, Shibo Chen, Gen Li, Jiashuo Jiang...
TL;DR提出了一种将强化学习与反馈图和内在动机探索相结合的决策框架,以提高应用强化学习在库存控制中的样本效率。