Apr, 2024

Verco:多智能体强化学习中协调语言沟通的学习

TL;DR我们提出了一种新的多智能体强化学习算法,将大型语言模型嵌入到智能体中,使其能够生成人类可理解的口头沟通,通过在智能体之间进行信息共享来显著提高学习效率和性能,并为人类提供解释多智能体合作过程的工具。