朝着基于多智能体通信的语言学习
本文提出了一种基于多智能体交互通信的语言学习框架,在指代游戏的上下文中研究了这种学习方法,通过联系人工智能代理人彼此通信以识别随机图像,在通过调整游戏环境来提高代理人交流的自适应语言结构,并为代理人的代码提出简单的系统,从而使其更好地恰当地通信,并能更有效地与人类沟通。
Dec, 2016
本文介绍一种结合多智能体通信和传统数据驱动方法的自然语言学习方法,通过在自身玩耍的环境中生成任务特定的奖励来适应或调节模型,形成任务条件化语言模型,并引入了一种基于语言模型样本重新排序的新方法,以优于其他方法地与人类进行视觉指称交流任务的通信。最后,我们提出了一种不同类型的语言漂移分类以及检测它们的措施。
May, 2020
本文提出了使用深度强化学习进行训练的带有通信能力的智能体在同时进行一系列指称游戏的计算框架,证明了框架反映了自然语言中观察到的语言现象,即语言演化的复杂属性可以不依赖于复杂的语言能力而是可以从视觉感知智能体之间的简单社交交流中产生。
Jan, 2019
通过玩转指代博弈,研究者们发现使用可微分方式(ST Gumbel-softmax estimator)的强化学习方法能够有效地解决学习沟通的问题,从而使得交互遵循自然语言的组成性和可变性。
May, 2017
该文提出了一种通过注入领域知识的方式来改善基于文本游戏中的智能代理的实现过程,并考虑了多种不同的注入策略,包括知识图谱和输入编码策略的增强,实验结果在 ScienceWorld 文本游戏环境中得到证明。
May, 2023
通过使用多模式和多步骤的指示性游戏,探讨了 AI 与 AI 之间的内部通信方式的变化,研究发现,较为逐渐的信息交换可以促进更好的预测和提高产生的通信协议的效率。
May, 2017
研究使用自我监督学习的方法,通过最大化给定轨迹信息的消息之间的互信息,使用一种新的视角诱导出一个共同语言,在通信关键的环境中取得了更好的学习表现和速度,以及学习出比现有方法更一致的共同语言,而且不需要引入额外的学习参数。
Mar, 2022