Nov, 2023

面向 AAM 应急管理的标准化强化学习框架

TL;DR通过整合 AAM-Gym 仿真框架中的紧急情况管理 MDP,本研究将紧急情况管理问题作为 Markov 决策过程,并将其快速原型化为强化学习算法,从而为未来算法开发提供一个社区基准。