多智体对话中自然语言并非 ' 自然 ' 出现
本文提出了一种基于多智能体交互通信的语言学习框架,在指代游戏的上下文中研究了这种学习方法,通过联系人工智能代理人彼此通信以识别随机图像,在通过调整游戏环境来提高代理人交流的自适应语言结构,并为代理人的代码提出简单的系统,从而使其更好地恰当地通信,并能更有效地与人类沟通。
Dec, 2016
探讨了人类和神经网络代理之间新兴通信协议的三个重要现象,包括学习容易性、泛化和群体规模影响,强调了认知和交际限制对语言结构的影响,在神经仿真中引入此类限制将促进更语言上可信的行为。
Apr, 2022
本篇论文提出一种内在奖励框架,通过强化学习设置两个代理,以在三个不同的指称游戏环境下将有限通道容量与内在奖励相结合,提高新颖环境下组合性得分约 1.5-2 倍。
Dec, 2020
本文介绍一种结合多智能体通信和传统数据驱动方法的自然语言学习方法,通过在自身玩耍的环境中生成任务特定的奖励来适应或调节模型,形成任务条件化语言模型,并引入了一种基于语言模型样本重新排序的新方法,以优于其他方法地与人类进行视觉指称交流任务的通信。最后,我们提出了一种不同类型的语言漂移分类以及检测它们的措施。
May, 2020
本文提出了使用深度强化学习进行训练的带有通信能力的智能体在同时进行一系列指称游戏的计算框架,证明了框架反映了自然语言中观察到的语言现象,即语言演化的复杂属性可以不依赖于复杂的语言能力而是可以从视觉感知智能体之间的简单社交交流中产生。
Jan, 2019
研究表明,随着深度人工网络的感知、移动和规划能力的增强,研究人员正在研究它们是否也能发展出共享语言来相互交互,并探讨语言在深度代理人群体中演化及紧急特性的条件,这既有助于理解人类语言进化的过程,也可以让深度网络在日常生活中更加灵活和有用。本文概述了各角度最具代表性的语言演化研究。
Jun, 2020
通过在多智能体通信中引入语言模型和视觉约束等训练约束,可以有效避免非语言性的奖励对预先训练的代理产生的语言漂移,从而使预先训练的代理在保留英语语法的同时学会准确传达信息。
Sep, 2019
人工智能代理器被证明在完成合作任务时可以学习交流,发现在学习的通信协议中存在某种语言结构(例如组合性),这种结构通常是训练过程中特定环境压力的结果。通过定期引入新的代理器来替换旧的,我们探索了一种新的压力 —— 教学的便捷性,并展示了其对结果语言结构的影响。
Jun, 2019