BriefGPT.xyz
Ask
alpha
关键词
bandit q-learning
搜索结果 - 1
基于赌博机策略的多智能体无冲突 Q 学习及其光学实现
本研究提出了一种基于量子干涉的光子强化学习算法,扩展了传统方法以解决动态环境下的多智能体强化学习问题,并演示了多智能体强化学习可以通过光子干涉加速,以此避免智能体之间的冲突。
PDF
2 years ago
Prev
Next