Aug, 2022

在线 3D 装箱强化学习解决方案(附缓冲区)

TL;DR本文提出了一种基于强化学习框架的三维装箱问题(3D-BPP)解决方案,其中引入了一个缓冲区以允许多物品动作选择,并提出了一种采用容器物品对称性的数据增强策略,采用类似于 AlphaGo 的模型 RL 方法进行实现,用单线程和 GPU 训练该框架,得出了在空间利用率方面优于现有成果的解决方案。