ICLRMar, 2023

多智能体强化学习中的廉价交流发现与利用

TL;DR本文针对合作多智能体增强学习方法中,通过便宜谈话渠道实现智能体之间的通信的问题,提出了一种基于互信息最大化的算法,分别对便宜话探测和利用进行了研究,并在这两个部分都优于现有算法的前提下,开发出一种新的框架,还发布了一套新的基准测试套件以刺激未来在便宜谈话渠道方面的研究。