Dec, 2023

自主用车系统中的多智能体深度强化学习中的全球激励

TL;DR自主按需移动(AMoD)系统中的车辆调度是本研究的重点,使用多代理深度强化学习(MADRL)算法,通过分配全局奖励,解决训练代理和操作者之间的目标冲突,从而实现了显著的性能改进和全局收益的优化。