- 学会交流,学会翻译
本文中,我们提出并测试了一种使用 Emergent Communication 技术,以先前预训练好的多语言模型来改进现代无监督机器翻译系统的方法,特别是对于语料库数据量很小的语言,我们将现代多语言模型嵌入到了一个以视觉为基础的语言游戏中, - 基于信息瓶颈原理的人 - 代理通信
本文研究了如何平衡效用、信息的有效性和复杂性,从而塑造新兴的通信,并将其与人类通信进行比较。我们使用 VQ-VIB 方法训练神经代理来压缩输入以获得离散信号,从而比以往的神经体系结构在其性能方面更具优越性,并发现惩罚交际复杂性可以维持高效用 - 通过深度生成模型的 Metropolis-Hastings 命名游戏实现紧急通信
该研究探索了一种新的通过基于概率生成模型的命名游戏来实现分布式贝叶斯推断的符号产生系统,并提出了利用无监督学习的 Emergent communication 方式来改善代理人的表现。
- ICLR通过语料库迁移将新兴语言和自然语言链接起来
本研究提出使用预训练在不同语言上的涌现语料库来解决语言涌现问题并在模拟自然语言下游任务的效果,评估不同指标识别涌现语言的可转移性。
- MM内在动机的组合语言生成
本篇论文提出一种内在奖励框架,通过强化学习设置两个代理,以在三个不同的指称游戏环境下将有限通道容量与内在奖励相结合,提高新颖环境下组合性得分约 1.5-2 倍。
- MM多智体学习系统中自然形成低带宽通信
研究团队通过对动物沟通的洞察提出了一个低带宽至高带宽的通信光谱,通过研究追逐与逃脱的游戏,确定了多智能体强化学习算法作为低带宽通信的计算模型。
- 紧急通讯针对少样本机器翻译的预训练
采用新颖的无监督知识转移方式,在缺乏语言数据时通过基于图像的指称游戏进行神经网络预训练,成功地提高了 few-shot 学习中的机器翻译效果,同时为评估人造语言的性质提供了基于表现的外部评估途径。
- 探索具有体现多智能体的零射击新兴通信
本研究探讨在多智能体环境中,利用关节执行通信的新型通信模式,解决现有符号通信模式不能够解决的一些问题,提出具体的训练改进方案,实现了对新伙伴的协议推广。
- MM衡量新兴交流中的非平凡组成性
本文考察了新兴交流领域的复杂性的度量标准,并实验显示大部分标准未能探测到复杂组合的存在。其中,唯一的例外是 Tree 重建误差这一度量标准,它强调了异构信号和组件意义之间的区别。这些结果强调了新兴通讯研究的重要限制,可能会阻碍对 NTC 的 - AAAI从多智能体强化学习框架中重构语言游戏范式
利用多智能体强化学习重构语言游戏实验范式,实现语言的产生及演变模型化,并促进多智能体系统中紧密沟通的学习和发展。
- 具有新兴通讯的网络多智能体强化学习
本研究使用紧密联系的智能体通过互相交流离散符号彼此合作完成任务。通过分析他们之间的交流,证明了他们发展的语言与网络拓扑有关,并在交通控制器问题上实现了最先进的性能。
- 学习合作:多智能体导航中的新兴通信
本研究探讨了人工智能代理的紧急沟通现象以了解其语言演化,发展出能够与人类有效沟通的人工智能系统,发现代理人在不同网格环境下进行合作导航任务时,学习了解释性的沟通协议,使其能够高效地解决任务,分析了代理人的策略,发现紧急信号在空间上聚集在一起 - MM泛化基于 emergent 原理的通信
研究将最近开发的 BabyAI 网格世界平台转变为发送者 / 接收者设置,以测试深层强化学习技术是否足以激励建立通用代理之间的基于地面的离散通信协议的假设。结果表明,适当的环境激励确实可以避免测量或特殊归纳偏差的情况,而且更长的通信间隔激励 - 多智能体强化学习中涌现交流的偏差
我们研究紧急通信的问题,其中语言的产生是因为说话者和听话者必须相互交流信息以解决任务。我们引入了正向信号和正向听取的归纳偏差来解决此问题,并在简单的单步环境中演示了这些偏差如何缓解学习问题,并将我们的方法应用于更广泛的环境中,表明具有这些归 - MM生物学与组合性:新兴沟通协议的实证考虑
本文探讨了关于 emergent communication 和 language origins 中 compositionality 和 reflexivity 的不同标准,指出了在未来的研究中注重 reflexivity 而非 com - MM避免使用 hash,并在引用的新兴语言游戏中鼓励视觉语义
本研究考虑了 Havrylov 和 Titov 的信令游戏设置,并研究了特征提取器的权重和解决的任务对模型所学习或捕捉的视觉语义的影响。通过对输入图像的各种增强和游戏中的附加任务的引入,实现了在完全自监督的情况下学习捕捉图像概念属性的视觉表 - 关于测量新兴通讯的陷阱
本文从深度强化学习代理在矩阵游戏中的表现出发,探讨现有的通信度量指标可能会存在的缺陷,并提出了适用时机和使用建议。
- NIPS模拟高速公路驾驶的车辆通信策略
本研究探讨了自动驾驶汽车之间的协调,并重点研究了通信如何影响代理机构的集体行为,结果发现通信在恶劣条件下具有帮助作用。
- ICLR多模态多步骤指代博弈中的紧急对话
通过使用多模式和多步骤的指示性游戏,探讨了 AI 与 AI 之间的内部通信方式的变化,研究发现,较为逐渐的信息交换可以促进更好的预测和提高产生的通信协议的效率。