Nov, 2023

使用通用价值函数学习领域支持的库存管理策略

TL;DR一个使用强化学习和通用值函数的库存管理方法,通过域支持的库存补货策略实现了平衡可用性和浪费等目标,并提供了对决策的领域支持洞察。