紧急量子化通信
本研究探讨在多智能体环境中,利用关节执行通信的新型通信模式,解决现有符号通信模式不能够解决的一些问题,提出具体的训练改进方案,实现了对新伙伴的协议推广。
Oct, 2020
通过使用深度 Q 学习,研究了多智能体强化学习在具有连续通信通道时的应用,发现基本组合特性会在学习的语言表示中出现。噪声在传达未经历过的概念组合时很重要,引入有倾向性的护理者可以使得新的交流创造出一种更有意义的基础语言。这个研究为深度强化学习与多智能体系统的进一步相关研究提供了平台。
Nov, 2021
本文研究了如何平衡效用、信息的有效性和复杂性,从而塑造新兴的通信,并将其与人类通信进行比较。我们使用 VQ-VIB 方法训练神经代理来压缩输入以获得离散信号,从而比以往的神经体系结构在其性能方面更具优越性,并发现惩罚交际复杂性可以维持高效用的同时维持类似人类的词汇量。此外,我们还发现,VQ-VIB 优于其他离散通信方法。
Jun, 2022
研究多智能体强化学习中新兴通信的交流方式,利用归纳偏差对连续信息的出现做出新增, 然后分别对离散和连续信息的增强学习或结合运用归纳偏差对两个娃玩具环境下的协商和序列猜测过程中所学到的通信协议进行演示,并表明这种学习方法可以对通信协议的学习产生益处。
Jun, 2023
研究将最近开发的 BabyAI 网格世界平台转变为发送者 / 接收者设置,以测试深层强化学习技术是否足以激励建立通用代理之间的基于地面的离散通信协议的假设。结果表明,适当的环境激励确实可以避免测量或特殊归纳偏差的情况,而且更长的通信间隔激励了更抽象的语义。一些情况下,通讯代理比一个单一的代理更快地适应了新环境,展示了新兴通信对于迁移学习和泛化的潜力。
Jan, 2020
本文提出了一种基于信息瓶颈的无监督方法,用于探索非常稀疏的多智能体增强学习中的社交通信情境,该方法可以捕捉引用复杂性和任务特定效用,并开发出一种自然语言灵感的信息组成的词汇表,该词汇表独立于一组紧急概念,使其具有极小的位数,同时可以使用社交影子的观测构成,并通过社交影子来学习通信策略。
Feb, 2023
通过玩转指代博弈,研究者们发现使用可微分方式(ST Gumbel-softmax estimator)的强化学习方法能够有效地解决学习沟通的问题,从而使得交互遵循自然语言的组成性和可变性。
May, 2017
通过研究 negotiation environment 中不同类型 agent 之间的交互过程,以及不同类型 agent 是否会进行 cheap talk,作者探讨了 cooperation 在语言产生中的必要性问题。
Apr, 2018