ICLRNov, 2021

通过连续声学通道实现多智能体通信,学会说话和听话

TL;DR通过使用深度 Q 学习,研究了多智能体强化学习在具有连续通信通道时的应用,发现基本组合特性会在学习的语言表示中出现。噪声在传达未经历过的概念组合时很重要,引入有倾向性的护理者可以使得新的交流创造出一种更有意义的基础语言。这个研究为深度强化学习与多智能体系统的进一步相关研究提供了平台。