Dec, 2022

城市尺度在线打车服务中基于深度强化学习的代理指导方向

TL;DR本论文研究了如何通过新的 reward scheme 和 deep reinforcement learning 方法 AM-DQN 来控制城市中的空车,以实现在线打车服务的供需平衡,并使用芝加哥的数据集进行了实验,结果表明 AM-DQN 相对于其他方法具有更好的性能。