Jul, 2023

微观尺度下环境对多智能体强化学习紧急策略的影响

TL;DR本文采用 Langevin 分子动力学模拟,探究了温度在微观环境下多智能体强化学习中策略出现及有效性方面的影响,发现在高温下智能体能够发现新的任务完成策略,并介绍了一个用于研究微观智能体强化学习的 Python 包。