朝着基于多智能体通信的语言学习

May, 2016

朝着基于多智能体通信的语言学习

Towards Multi-Agent Communication-Based Language Learning

Angeliki Lazaridou, Nghia The Pham, Marco Baroni

TL;DR提出了一种交互式多模态框架，通过协作推理游戏，实现神经网络学习语言，初步实验结果可喜，但需注意避免智能体发展出仅针对游戏有效的特定通信编码。

Abstract

We propose an interactive multimodal framework for language learning. Instead of being passively exposed to large amounts of natural text, our learners (implemented as feed-forward →

interactive multimodal framework language learning neural networks cooperative referential games ad-hoc communication

发现论文，激发创造

多智能体合作与（自然）语言的出现

本文提出了一种基于多智能体交互通信的语言学习框架，在指代游戏的上下文中研究了这种学习方法，通过联系人工智能代理人彼此通信以识别随机图像，在通过调整游戏环境来提高代理人交流的自适应语言结构，并为代理人的代码提出简单的系统，从而使其更好地恰当地通信，并能更有效地与人类沟通。

Dec, 2016

多智能体通信与自然语言：功能与结构语言学之间的协同

本文介绍一种结合多智能体通信和传统数据驱动方法的自然语言学习方法，通过在自身玩耍的环境中生成任务特定的奖励来适应或调节模型，形成任务条件化语言模型，并引入了一种基于语言模型样本重新排序的新方法，以优于其他方法地与人类进行视觉指称交流任务的通信。最后，我们提出了一种不同类型的语言漂移分类以及检测它们的措施。

May, 2020

多智能体通信中的突现式翻译

本文提出了一种基于多模态视觉的交互式语言学习模型，无需平行语料库即可实现语言的相互理解和翻译，并表明使用该模型的多语言社区实现了更好和更快的翻译结果。

Oct, 2017

多智能体通讯游戏中的紧急语言现象

本文提出了使用深度强化学习进行训练的带有通信能力的智能体在同时进行一系列指称游戏的计算框架，证明了框架反映了自然语言中观察到的语言现象，即语言演化的复杂属性可以不依赖于复杂的语言能力而是可以从视觉感知智能体之间的简单社交交流中产生。

Jan, 2019

多智能体游戏中语言的出现：学习使用符号序列进行沟通

通过玩转指代博弈，研究者们发现使用可微分方式（ST Gumbel-softmax estimator）的强化学习方法能够有效地解决学习沟通的问题，从而使得交互遵循自然语言的组成性和可变性。

May, 2017

互动文本游戏的知识增强代理

该文提出了一种通过注入领域知识的方式来改善基于文本游戏中的智能代理的实现过程，并考虑了多种不同的注入策略，包括知识图谱和输入编码策略的增强，实验结果在 ScienceWorld 文本游戏环境中得到证明。

May, 2023

多模态多步骤指代博弈中的紧急对话

通过使用多模式和多步骤的指示性游戏，探讨了 AI 与 AI 之间的内部通信方式的变化，研究发现，较为逐渐的信息交换可以促进更好的预测和提高产生的通信协议的效率。

May, 2017

高效机器通信的持续自适应

本研究提出了一个基于交互式重复参考任务的连续学习框架，以更准确和高效地与伙伴通信，并通过 COCO 的模拟和与人类伙伴的实时参考游戏实验进行了评估。

Nov, 2019

用对比学习实现分散式多智能体通信的学习

研究使用自我监督学习的方法，通过最大化给定轨迹信息的消息之间的互信息，使用一种新的视角诱导出一个共同语言，在通信关键的环境中取得了更好的学习表现和速度，以及学习出比现有方法更一致的共同语言，而且不需要引入额外的学习参数。

Mar, 2022

从多智能体强化学习框架中重构语言游戏范式

利用多智能体强化学习重构语言游戏实验范式，实现语言的产生及演变模型化，并促进多智能体系统中紧密沟通的学习和发展。

Apr, 2020