ICMLJun, 2023

Meta-SAGE: 尺度元学习调度适应与引导勘探在组合优化中缓解尺度漂移

TL;DR本文提出了 Meta-SAGE,一种用于改善组合优化(CO)任务中深度强化学习模型的可伸缩性的新方法。 我们的方法通过建议两个组件:一个比例元学习器(SML)和指导探索的计划适应性(SAGE),将预训练模型适应到测试时间中的更大规模的问题,结果表明 Meta-SAGE 优于以前的适应方法,并且显着提高了具有代表性的 CO 任务的可伸缩性。