Dec, 2022
基于赌博机策略的多智能体无冲突 Q 学习及其光学实现
Bandit approach to conflict-free multi-agent Q-learning in view of photonic implementation
Hiroaki Shinkawa, Nicolas Chauvet, André Röhm, Takatomo Mihana, Ryoichi Horisaki...
TL;DR本研究提出了一种基于量子干涉的光子强化学习算法,扩展了传统方法以解决动态环境下的多智能体强化学习问题,并演示了多智能体强化学习可以通过光子干涉加速,以此避免智能体之间的冲突。