Jan, 2024

基于图表示的可扩展列车时刻表重排的强化学习

TL;DR火车时刻表重新调度的研究中,通过基于强化学习的方法,设计了一个简单的有向图来表示问题,并利用图神经网络自动提取信息状态;通过改变解决方案的构建过程,使得决策模型与问题规模解耦合,确保生成方案的可行性;为模型设计了一个学习课程来处理不同程度延误的情况;并且提出了一个简单的局部搜索方法,显著提高了解决方案的质量,实验结果证明了该方法在解决各种不同程度火车延误和规模问题时比手工规则和现有解决方法具有更好的性能。