Nov, 2024

探索多智能体强化学习在不相关并行机器调度中的应用

TL;DR本研究解决了涉及设定时间和资源的不相关并行机器调度问题,采用多智能体强化学习(MARL)方法。通过实证分析,比较了MARL与单智能体算法的表现,发现多智能体PPO算法在多智能体环境中显示出可扩展性,尽管在协作学习上面临挑战。这项研究为调度优化的MARL技术应用提供了新视角,强调了算法复杂性与可扩展性之间的平衡。