- EXPIL:游戏学习中的解释性谓词创造
通过自我发明谓词来减少对预先定义背景知识的依赖,从而实现对逻辑代理的可解释行为。
- 基于信息瓶颈原理的人 - 代理通信
本文研究了如何平衡效用、信息的有效性和复杂性,从而塑造新兴的通信,并将其与人类通信进行比较。我们使用 VQ-VIB 方法训练神经代理来压缩输入以获得离散信号,从而比以往的神经体系结构在其性能方面更具优越性,并发现惩罚交际复杂性可以维持高效用 - ICLR基于代理的图神经网络
介绍了一种新的图神经网络 - AgentNet,它采用了次线性算法,并使用智能的神经代理遍历图,能够识别 2-WL 无法区分的结构并在图分类任务中表现良好。
- ICLR紧急沟通:了解人类语言演化还缺什么?
探讨了人类和神经网络代理之间新兴通信协议的三个重要现象,包括学习容易性、泛化和群体规模影响,强调了认知和交际限制对语言结构的影响,在神经仿真中引入此类限制将促进更语言上可信的行为。
- ICCV视觉语言导航的史诗变压器
本文提出了一种名为 Episodic Transformer (E.T.) 的多模态 Transformer,可解决使用自然语言指令进行交互和导航所面临的挑战。通过采用合成指令来改善训练和决策,使得 E.T. 能够处理历史信息,以实现复合式 - 有界预知下的 Atari 游戏防护
针对深度强化学习在安全关键领域中的应用,本研究提出了一种确保 Atari 电子游戏中 DRL 智能体安全的方法,仅需使用仿真器即可进行分析,此方法可有效提高智能体的安全性。
- ACL关于离散和组合信号的自发出现
本文提出了一种基于信号博弈和神经代理的语言产生的通用框架,通过采用连续潜空间,我们能够使用反向传播训练,展示离散信息的自然出现,探讨分类感知效应的跟进,并表明这些信息不是组成式的。
- 紧急语言的概括和学习速度与组合性无关
两个实验表明,根据任务不同,非复合语言可能显示出与符合语言相等或更好的泛化性能和习得速度,因此在这个领域的进一步研究应更清晰地阐明复合性预期的哪些好处和如何实现。
- ACL指涉游戏中语言和智能体的共同演化
通过模拟代理人群体的文化和架构演进,研究发现,当语言习得者的学习偏好被考虑在内时,语言和代理人的共同进化可以得到最优解,这一发现强调了研究代理人架构的重要性,并为语言的起源研究铺平了道路。
- ICML紧凑语言中的熵最小化
研究神经代理在通讯任务中共同训练时出现的语言,并聚焦于两个代理一次交流的基本设置,发现这类语言呈现出信息论复杂性且受到熵极小化压力的影响。
- ICLR从原始视觉输入中学习组合式取反通信
本文介绍了一种利用神经代理从原始图像像素中学习视觉感知,并使用一系列离散符号进行通信的方法,以进行图像描述游戏。通过定性分析、可视化和零样本测试,证明了代理可以在适当的环境压力下从原始图像像素中发展出复合属性的语言。