Oct, 2024

选择比努力更重要:大型语言模型促进高效的多智能体探索

TL;DR本研究针对强化学习中存在的高维状态—动作空间中的多智能体探索效率问题,提出了一种新颖的系统方法LEMMAE。通过合理引导来自大型语言模型的任务相关知识,该方法显著提高探索的效率,并在挑战性基准上超越了现有的最优方法,某些情况下实现了10倍的加速。