Jun, 2015

累积前景理论与强化学习相遇:预测和控制

TL;DR本研究采用累积概率理论将风险敏感型强化学习应用到交通信号控制领域,并提出了一种估算方法和优化程序,保证了算法的收敛性。