May, 2023

结构化信号博弈中的实用推理

TL;DR在本文中,我们介绍了一种结构化信号博弈,一种在上下文中意义之间具有相似性结构的经典信号博弈的扩展形式,以及一种我们称之为结构化 RSA(sRSA)的 Rational Speech Act(RSA)框架变体,用于结构化领域中的信息推理。我们研究了 sRSA 在颜色领域的行为,并显示出在仅进行 1 或 2 个递归级别后,使用 sRSA 的语用代理在来自 World Color Survey 的语义表示上达到了接近信息论界限的效率。我们还探讨了语用推理与多智能体强化学习框架中的学习之间的相互作用。我们的结果说明,使用 sRSA 的人工代理比使用 RSA 和仅强化学习的代理开发出更接近信息论前沿的通信。我们还发现,在允许语用代理在学习过程中进行更深入的彼此推理时,语义表示的歧义性会增加。