泛化基于 emergent 原理的通信
我们研究紧急通信的问题,其中语言的产生是因为说话者和听话者必须相互交流信息以解决任务。我们引入了正向信号和正向听取的归纳偏差来解决此问题,并在简单的单步环境中演示了这些偏差如何缓解学习问题,并将我们的方法应用于更广泛的环境中,表明具有这些归纳偏差特征的工作代理人实现了更好的性能,并分析了导致的通信协议。
Dec, 2019
通过研究 negotiation environment 中不同类型 agent 之间的交互过程,以及不同类型 agent 是否会进行 cheap talk,作者探讨了 cooperation 在语言产生中的必要性问题。
Apr, 2018
本文提出了一种新的模型和训练算法,在以原始像素为输入的环境中,利用学习到的表征空间的结构产生更一致的发言者,稳定学习,并提出了一种用于度量文本独立性的新型基于对齐的指标,相比策略梯度和其他竞争基线,我们的算法在通信效果方面有了大幅提升。
Sep, 2018
本研究探讨在多智能体环境中,利用关节执行通信的新型通信模式,解决现有符号通信模式不能够解决的一些问题,提出具体的训练改进方案,实现了对新伙伴的协议推广。
Oct, 2020
研究多智能体强化学习中新兴通信的交流方式,利用归纳偏差对连续信息的出现做出新增, 然后分别对离散和连续信息的增强学习或结合运用归纳偏差对两个娃玩具环境下的协商和序列猜测过程中所学到的通信协议进行演示,并表明这种学习方法可以对通信协议的学习产生益处。
Jun, 2023
通过玩转指代博弈,研究者们发现使用可微分方式(ST Gumbel-softmax estimator)的强化学习方法能够有效地解决学习沟通的问题,从而使得交互遵循自然语言的组成性和可变性。
May, 2017
现有关于基于深度学习代理之间紧急通信的研究受到广泛关注,因为它对语言学和人工智能有启发作用。本研究提出了一个认知导向的环境 —— 推理游戏,鼓励代理人进行高层次规则的推理和沟通,而不是感知低层次环境。实验结果表明,在推理游戏中,出现了一个语义稳定且组合性强的语言来解决推理问题。这种演化的语言帮助代理人将提取的规则应用到看不见的环境属性的推广中,以及不同环境属性甚至任务之间的迁移。
Nov, 2023
本文提出了一种基于信息瓶颈的无监督方法,用于探索非常稀疏的多智能体增强学习中的社交通信情境,该方法可以捕捉引用复杂性和任务特定效用,并开发出一种自然语言灵感的信息组成的词汇表,该词汇表独立于一组紧急概念,使其具有极小的位数,同时可以使用社交影子的观测构成,并通过社交影子来学习通信策略。
Feb, 2023
在现代机器学习中,标准强化学习算法在学习竞争代理之间的通信方面表现出仅有的负面结果。我们引入了一种改进的发送者 - 接收者游戏来研究部分竞争场景的光谱,并展示了通信确实可以在竞争环境中出现。我们通过实验证明了以下三个关键的研究成果。首先,我们表明通信与合作成正比例,并且可以使用标准学习算法在部分竞争的场景中发生。其次,我们强调了通信和操纵之间的区别,并将以前的通信度量扩展到了竞争的情况下。第三,我们研究了协商游戏,在此之前的研究未能学习到独立代理之间的通信(Cao et al.,2018)。我们证明,在这种情况下,两个代理都必须受益于通信才能出现;通过对游戏进行轻微修改,我们展示了竞争代理之间成功通信的情况。我们希望这项工作能推翻误解并激发更多的竞争性新兴通信方面的研究。
Jan, 2021
本研究探讨了人工智能代理的紧急沟通现象以了解其语言演化,发展出能够与人类有效沟通的人工智能系统,发现代理人在不同网格环境下进行合作导航任务时,学习了解释性的沟通协议,使其能够高效地解决任务,分析了代理人的策略,发现紧急信号在空间上聚集在一起,信号指向特定的位置和空间方向,如 “左”,“上” 或 “左上房间”,使用代理人群体,我们展示了出现的协议具有基本组合结构,从而表现出自然语言的核心属性。
Apr, 2020