May, 2024

eQMARL: 量子通道上分布式协作的纠缠量子多智能体强化学习

TL;DR提出了一种名为 eQMARL 的新型框架,通过量子通道促进协作,并通过量子纠缠的分裂评论家消除本地观察共享,实验结果表明,eQMARL 相较于传统的分裂和完全中心化的经典和量子基线,能够在更短的时间内收敛到合作策略,且拥有更高的整体分数,与传统的分裂经典基线相比,eQMARL 只需要少于 25 倍的中心化参数。