不可预测领域谈判团队通用的一致接受协议

MMApr, 2016

不可预测领域谈判团队通用的一致接受协议

Unanimously acceptable agreements for negotiation teams in unpredictable domains

Victor Sanchez-Anguix, Reyhan Aydogan, Vicente Julian, Catholijn Jonker

TL;DR文章研究了对需要团队决策一致的情况下的团队决策制定，并基于贝叶斯学习来提供团队成员的决策策略。实验结果表明，如果团队成员使用贝叶斯学习来建立对队友的了解，则团队的决策效果会得到提高。

Abstract

A negotiation team is a set of agents with common and possibly also conflicting preferences that forms one of the parties of a negotiation. A negotiation team is involved in two →

negotiation team decision making unanimity bayesian learning strategies

发现论文，激发创造

灵活的团队合作

提供代理工具以协调和沟通，通过 STEAM 构建团队，以探讨面临的不确定性，并在多个复杂领域中应用，实现降低团队沟通负担，提高团队协作效率的目的。

Sep, 1997

沟通式多智能体团队决策问题：分析团队协作理论和模型

为解决多智能体协同中的最优性和复杂性问题，研究提出了一种统一框架，称为 COM-MTDP，它将多智能体理论结合并推广，并提供了一种可用于评估最优性 - 复杂性交换的工具，并为团队协调算法的开发提供了基础；通过该框架分析了不同问题领域下构建最优团队的计算复杂性，以及了两种联合意图策略的优选通信策略比较。

Jun, 2011

多智能体学习中团队合作的益处探究

本文提出了一种基于组织心理学和早期人工智能团队工作的新型强化学习智能体多智能体团队模型，验证结果表明，尽管有不合作的动机，代理分成团队后仍然能发展出合作的政策，能在团队内更好地协调和学习相应角色，并比所有代理利益一致时获得更高的回报。

May, 2022

规范分歧作为协作人工智能的挑战

研究多智能体协作中存在的利益冲突问题及其解决方案，提出采用规范自适应策略以增加协作。

Nov, 2021

N 代理临时团队合作

在多智能体环境中学习合作行为的现有方法通常假设相对限制性的情景，在完全合作的多智能体强化学习中，学习算法控制着场景中的所有智能体，而在特定团队合作中，学习算法通常只控制场景中的单个智能体。然而，在现实世界中，许多合作场景要求更灵活的学习方法。本文提出了 N - 智能体特定团队合作算法（POAM），用于解决在评估阶段必须与动态变化的不同类型的队友进行交互和合作的智能体问题，并通过学习队友行为的表示来适应各种队友行为。在《星际争霸 II》任务的实证评估中，POAM 相对于基准方法提高了协作任务的回报，并实现了对未见过队友的分布外泛化。

Apr, 2024

满足分布式动态团队信任的步骤

在动态多代理团队中，定义和衡量信任是非常重要的，特别是在国防和安全领域。我们关注的是如何定义目标和价值，以便能够以可解释的方式定义 ' 信任 '，并且人机皆可使用。我们提出了一套可以被人类或机器人团队成员理解的度量标准来定义人机团队之间的信任，并考虑了一个可以演示 ' 满意信任 ' 概念的实验。

Sep, 2023

多智能体团队学习的更深层理解

研究团队结构在群体学习中的影响，结果显示，某些团队结构帮助代理程序学习特定角色，从而获得更有利的全局结果；然而，大型团队创建的信用分配挑战降低了协调性，导致大型团队表现不如小型团队。

Jun, 2023

模拟人工智能团队决策

研究表明，当涉及到风险元素和评估人类和 AI 代理能力的探索利用过程时，人工智能和人类在小组决策方面具有互补技能。本文面向一组带有缺陷的 AI 代理人，向人类团队提交一系列智力问题，以评估团队成员和可用 AI 代理人的相对专业知识，评估不同行动的风险并通过达成共识来最大化整体回报，并提出了人工智能 - 人类团队决策的模型。研究验证了在不确定情况下的人工智能团队和人类行为预测中的前景理论、影响动态和贝叶斯学习的社会认知构建的价值。

Jan, 2022

团队最大最小均衡：效率界限与算法

研究了团队最大最小均衡及其相关算法在战略游戏中的应用，并探讨了其相对于纳什均衡和最大最小均衡的效率界限。

Nov, 2016

实时人 - 智能体协同的自适应智能体架构

提出一种基于预训练的 RL 策略库和规则策略的人类无模型自适应代理架构，通过一种新的相似性度量方法推断人类策略并选择最具互补性的策略，以此最大化团队在人类机器协作中的总体表现。

Mar, 2021