Oct, 2023

在线 3D 装箱的可调鲁棒强化学习

TL;DR在线 3D 装箱问题(3D-BPP)的有效政策设计一直是一个长期的挑战,本文提出了可调整鲁棒性强化学习(AR2L)框架,通过调整鲁棒性权重实现策略在平均情况和最坏情况下的平衡,以提升策略的鲁棒性同时保持较高的性能水平。