合作互动中的局部最小值驱动通讯

Jul, 2023

合作互动中的局部最小值驱动通讯

Local Minima Drive Communications in Cooperative Interaction

Roger K. Moore

TL;DR人机交互中的一个重要问题是何时决定通信，特别是在合作任务中；感知控制理论表明，代理能通过共享相同的意图在合作任务中协作，但对于包含局部最小值的任务，至少有一个代理在适当时刻调整意图通过适时的通信，协调动作，在复杂的搜索空间中实现全局解。

Abstract

An important open question in human-robot interaction (HRI) is precisely when an agent should decide to communicate, particularly in a cooperative task. →

human-robot interaction cooperative task perceptual control theory communication coordination

发现论文，激发创造

多智能体强化学习：实用沟通和控制

这篇论文提出了一种名为 “Cyber-Physical POMDP” 的模型，将目标导向通信和网络控制相结合，以实现分散的移动机器人的协调，通过联合训练可以显着提高总体性能并可导致通信行动的隐式协调。

Feb, 2023

合作通信的数学理论

合作交流在人类认知、语言、发展、文化和人机交互理论中发挥着核心作用，本文提出了一种采用最优传输理论建立数学框架的新模型，证明了合作交流能够促进有效、鲁棒的信念传播，从而解释了人类学习的奇迹，并改进了人机交互。

Oct, 2019

不谈话的规划：抗通信丢失的多智能体系统

该论文针对协作多智能体系统中的通信问题，提出了一种分散执行联合策略算法，运用状态 - 行为过程的总相关度估计代表多智能体间内在依赖关系的指标，通过最大化一个该指标的代理量，合成了最小依赖联合策略，并在数值实验中验证其鲁棒性和高性能。

Jan, 2022

共享过程抽象的通信学习

研究如何使用自然语言来协同解决物理装配问题，结果表明，参与者通过使用更高级别的指称表达逐渐提供越来越简洁的指示，从而达成了共享过程中的概念抽象，这为智能体之间的共同程序化抽象的协调提供了归纳偏见的启示。

Jun, 2021

学习通信感知协调的机器人群体模拟

本研究主要探讨了如何应用基于观察专家演示的控制器学习算法，训练出端到端的神经网络，用于解决协作多智能体系统中的分布式控制问题，实验结果表明，使用通信策略可以有效提高分布式模型的性能。

Feb, 2023

在不完美的信道上学会合作与沟通

多智能体系统中的信息交流在部分可观察环境中提高智能体之间的合作，本文考虑了基于有限和不可靠信道下智能体的合作通信，通过提出一种基于独立 Q 学习的新型通信方法，智能体可以动态适应信息共享的量，从而根据本地观察和信道特性发送不同大小的消息，同时智能体学习编码和解码消息以提升共同训练的策略，在合作式数字预测环境中，我们展示了相比于没有自适应能力的方法，我们的方法表现更好，并讨论了其在交通路口环境中的局限性。

Nov, 2023

从行动和指令推断沟通代理的目标

研究了协作团队之间的自然语言指令传递在多模态贝叶斯逆向规划中的应用，发现使用语言指令可以更快、更准确地推断出团队目标，强调了语言沟通对于协作任务的重要性。

Jun, 2023

多智能体协作感知中的实用沟通

通过合作感知，我们提出一种多智能体合作的感知系统 PragComm，通过主动选择消息、优化消息表示和选择有益的合作者，从而降低通信成本并提高任务性能。

Jan, 2024

游戏中基于自然语言沟通的人工智能与人类协作

在信息不对称的情况下，开发能够制定策略并与人类合作的自主代理人是具有挑战性的，需要有效的自然语言交流。我们引入了一个共享控制游戏，两个玩家轮流共同控制一个令牌，以在不完整信息下实现共同目标。我们对一个自主代理人在此游戏中与另一位玩家（人类）的政策综合问题进行了数学建模。为了解决这个问题，我们提出了一种基于通信的方法，包括一个语言模块和一个规划模块。语言模块将自然语言消息与定义玩家意图的有限标志集之间进行翻译。规划模块利用这些标志，使用我们提出的基于不对称信息集的蒙特卡洛树搜索与标志交换算法计算策略。我们使用《夜间侏儒》作为基础的测试场景进行了这种方法的有效性评估，该场景是一个搜索和找到迷宫棋盘游戏。人类主体实验的结果表明，通过交流，玩家之间的信息鸿沟变小，合作效率提高，并减少回合数。

May, 2024

端到端自动驾驶合作感知的选择性通信

本文提出了一种基于选择性通信算法的合作感知方法，用于提高当前自动驾驶系统在障碍物干扰场景下的可靠性。通过多智能体路径规划研究的启发，将感知网络与控制网络相结合，实现了对有关导航规划最为关键的感知信息的选择传输，在安全关键驾驶场景模拟中显示出了比随机选择方法更高的成功率，同时最小化了附加通信开销。

May, 2023