NIPSJun, 2023

连续环境下新兴通讯的归纳偏差

TL;DR研究多智能体强化学习中新兴通信的交流方式,利用归纳偏差对连续信息的出现做出新增, 然后分别对离散和连续信息的增强学习或结合运用归纳偏差对两个娃玩具环境下的协商和序列猜测过程中所学到的通信协议进行演示,并表明这种学习方法可以对通信协议的学习产生益处。