结构化信号博弈中的实用推理

May, 2023

Pragmatic Reasoning in Structured Signaling Games

Emil Carlsson, Devdatt Dubhashi

TL;DR在本文中，我们介绍了一种结构化信号博弈，一种在上下文中意义之间具有相似性结构的经典信号博弈的扩展形式，以及一种我们称之为结构化 RSA（sRSA）的 Rational Speech Act（RSA）框架变体，用于结构化领域中的信息推理。我们研究了 sRSA 在颜色领域的行为，并显示出在仅进行 1 或 2 个递归级别后，使用 sRSA 的语用代理在来自 World Color Survey 的语义表示上达到了接近信息论界限的效率。我们还探讨了语用推理与多智能体强化学习框架中的学习之间的相互作用。我们的结果说明，使用 sRSA 的人工代理比使用 RSA 和仅强化学习的代理开发出更接近信息论前沿的通信。我们还发现，在允许语用代理在学习过程中进行更深入的彼此推理时，语义表示的歧义性会增加。

Abstract

In this work we introduce a structured signaling game, an extension of the classical signaling game with a similarity structure between meanings in the context, along with a variant of the Rational Speech Act (RSA) framework which we call →

structured signaling game structured-rsa pragmatic reasoning color multi-agent reinforcement learning

发现论文，激发创造

通过自我监督实现可扩展的实用沟通

本文提出了一种可扩展的语用学方法，通过信息论原理来在代理人之间掌握语用技能，建立了一种新的架构和学习过程，而不是依靠人类数据。

Aug, 2021

合理言语行动模型中的学习

通过定义和优化经训练的统计分类器，RSA 模型可用作自然语言处理应用程序的隐藏层，从而打开了新的应用领域和有效从数据学习的可能性，我们在指代表达生成任务中验证了该模型，表明将有关自然语言生成的洞见特征纳入 RSA 中可实现最佳性能。

Oct, 2015

人类实用推理的速率 - 失真视角

本文研究了何种计算原则支持人类实用推理。使用 RSA 框架，论文以概率说话者和听者递归推理为基础，分析了 RSA 递归推理动力学，并探讨了相关的信息理论原则，以实现优化实用程序和交际努力的平衡。

May, 2020

通过摊销语用推理来学习信息性指称

本文讨论了人类语言的理论模型 Rational Speech Acts (RSA) 框架下通过递归社会推理来捕捉语用现象的一种思路，并通过使用点对点通信游戏数据集，设计了一种新的模型来实现基于内部听众模型的成本分摊机制，实现了在多种语境下快速生成有效而简洁的语言。

May, 2020

学习调解差异以促进实用交流

本研究提出了一种基于 Pragmatic Rational Speaker 的框架，通过在工作记忆中添加轻量级差异调整层来学习演讲者 - 听者差异并相应地调整演讲，从而实现了一种类似于人类交流的 AI 代理能力。实证结果证明，该框架能够显著提高协作任务的结果。

Mar, 2022

使用排序法摊销实用的程序合成

在程序综合中，通过使用 Rational Speech Acts（RSA）框架，一个智能系统接收用户生成的示例集合并返回与这些示例在逻辑上一致的程序。本文介绍了一种使用全局实用排序的新型 RSA 算法摊销方法，通过该方法可以在在线、多示例设置中有效地近似全面实用的综合器，并相比 RSA 综合器获得数量级的速度提升，同时胜过非实用综合器。

Sep, 2023

利用排序规则分摊实用程序综合

利用理性言语行为（RSA）框架在构建与用户生成的例子逻辑一致且注重用户选择例子信息性的计算机程序综合器方面取得了成功。本研究提出了一种摊销慢速、精确的 RSA 综合器的通用方法，通过先查询精确的 RSA 综合器来编制一个通信数据集，这一数据集包含了与程序子集相关的示例依赖排序。然后将这些排序抽取为对所有程序的单个全局排序，以近似数据集中的每个排序。在推理时，使用该全局排序来对由一个快速、非实用的综合器生成的多个逻辑一致的候选程序进行排序。在两个程序综合领域的实验中，我们的排序方法相比于精确的 RSA 综合器获得了数量级的加速度，并在与人类交流时比一个非实用的综合器更准确。最后，我们证明了在从单个例子进行综合的特殊情况下，此近似方法是精确的。

Jun, 2024

一种基于 Rational Speech Act 框架的指称表达：概率方法

利用 RSA 框架与深度学习方法相结合，在多步骤过程中生成更好的、可解释的表述，在复杂的视觉场景中进行实验，比较我们的方法与其他端到端深度学习方法以及 RSA 变体的表现，结果表明，我们的方法在人类理解方面优于类似 RSA 方法，而在有限数据的情况下优于端到端深度学习。

May, 2022

朝着一个完全可解释且更可扩展的基于 RSA 模型的隐喻理解模型

我们引入了一个新的基于合作信息的 RSA 框架用于隐喻理解，该框架通过提供一个明确的公式来估计交际目标，并使用基于梯度的方法学习合理性参数，从而解决了现有 RSA 模型在解释性和可扩展性方面的局限性。实验结果表明，模型生成的分布与人类行为数据的解释之间存在强正相关性，特别是当意图的含义涉及到目标概念固有属性时，相关性更加明显。研究结果表明，隐喻处理可以很好地由基于典型性的贝叶斯模型捕捉到，即使其具有更大的可扩展性和解释性，也可以应用于其他语用现象和提高大型语言模型的可解释性，然而，结果还突显出，与词汇概念中不严格编码的隐喻含义相比，更具创造性的细微差别是机器难以捕捉到的挑战性方面。

Apr, 2024

序列语言博弈中的规划、推理和语用学

研究顺序语言游戏中的私人信息通信，并提出能够捕获人类行为的模型。

May, 2018