Jan, 2023

多智能体强化学习中多个独立顾问的学习

TL;DR本文提出了一种基于两级 Q-learning 架构的学习模型,可以同时从多个独立顾问中学习,以提高多智体强化学习在复杂环境下的效率和性能