Jun, 2023

RL4CO:组合优化广泛强化学习基准测试

TL;DR我们介绍了 RL4CO,这是一个全面的强化学习用于组合优化(CO)基准测试。我们通过模块化和配置管理等最佳实践来实现高效性和易于修改性,并重点强调可扩展性和广义能力对于各种优化任务的重要性,我们系统地评估了各种模型的样本效率,零射击推广以及数据分布变化的适应性。我们的实验表明,当使用这些新指标进行评估时,一些最新的最先进的方法落后于其前辈,这表明需要更平衡的观点来评估神经网络 CO 求解器的性能。我们希望 RL4CO 将鼓励探索解决复杂现实世界任务的新型解决方案,通过将科学与软件工程分离的标准化接口与现有方法进行比较。我们在此 https URL 上公开发布我们的库。