Nov, 2023

分解环境的分阶段强化学习用于复杂任务

TL;DR通过将复杂任务分解为多个子任务并在交通路口模拟中引入多智能体训练机制,本研究提出了两种方法来近似强化学习问题并改善代理人在复杂任务中的性能,从而减少潜在的安全问题。