ICMLOct, 2019

部分检测智能交通信号控制:环境适应

TL;DR本研究旨在探究强化学习算法在 PD-ITSC 中应用的可行性及其应对瞬态变化场景的效果,结果表明相较于基于值函数的算法,基于策略的算法对于应对瞬态环境变化更加有效。