AAAIAug, 2022

量子多智能体元强化学习

TL;DR本文提出 QM2ARL,利用量子神经网络的两个不同维度的参数来重新设计 MARL,实现了元学习和记忆地址功能,并通过模拟验证了其在高回报和快速收敛方面的有效性。