A2C：一个面向人工智能团队的模块化多阶段协作决策框架

Jan, 2024

A2C：一个面向人工智能团队的模块化多阶段协作决策框架

A2C: A Modular Multi-stage Collaborative Decision Framework for Human-AI Teams

Shahroz Tariq, Mohan Baruwal Chhetri, Surya Nepal, Cecile Paris

TL;DR该论文介绍了 A2C，一个多阶段协作决策框架，旨在实现人工智能与人类团队之间的强大决策能力。在概念上借鉴了拒绝学习和学习推迟等概念，A2C 将人工智能系统训练成能够识别决策的不确定性，并在需要时推迟决策以便向人类专家求助。此外，A2C 还适用于人类专家面临限制的场景，例如在网络安全运营中心的事件检测和响应中。在这些场景下，A2C 促进协作探索，实现复杂挑战的集体解决。通过支持自动化、增强和协作三种不同的人工智能决策模式，A2C 为开发有效的人工智能协作策略提供了灵活的平台。通过发挥人类和人工智能的优势，它显著提高了动态和不断变化环境中复杂决策的效率和效果。为了验证 A2C 的能力，我们使用基准数据集进行了广泛的模拟实验。结果清楚地表明，A2C 能够有效支持三种决策模式。尤其值得注意的是，（模拟）人类专家和人工智能的协作探索相比单独的人工智能表现出更优异的性能，突显了该框架增强人工智能与人类团队决策能力的潜力。

Abstract

This paper introduces a2c, a multi-stage collaborative decision framework designed to enable robust decision-making within human-ai teams. Drawing inspiration from concepts such as rejection learning and learning

a2c collaborative decision-making human-ai teams uncertainty recognition cyber security operations centres

发现论文，激发创造

决策中的人工智能协作：超越推迟学习

通过研究发现，目前 Human-AI collaboration 在决策方面已经有了一定的进展，但还存在一些问题需要解决，如性能和公平性不足，学习模型的部署需要考虑实际环境等方面，需要更多的研究进行完善。

Jun, 2022

通过鲁棒性和关键性，结合人工智能控制系统和人类决策支持

AI 控制系统和对抗性解释在增强学习中具有广泛的应用，可用于智能决策工具和训练框架，增强决策和解释的能力，并提供强大的防御能力。

Jul, 2024

未来指挥与控制的可扩展交互式机器学习

未来作战将要求指挥与控制（C2）人员在复杂且潜在模糊的情况下以缩短的时间段做出决策。与机器学习算法合作以引导算法行为的交互式机器学习有望在 C2 作战过程中发挥潜力，带来适应性和效率的革新。本文提出在现有科学技术中存在的一些差距，并描述了三个研究重点领域，旨在实现可扩展的交互式机器学习（SIML）：1）开发人工智能交互算法以在复杂动态情境下进行规划；2）通过优化角色、配置和信任来培养弹性的人工智能与人类团队；3）为适应一系列潜在情境和情况扩大算法和人工智能团队的规模。

Feb, 2024

通过学习有说服力的解释优化人工智能与人类的合作

提出了一种协作系统，其中人类最终做出决策，同时给予模型以最佳机会进行解释并与其辩论，从而解决了机器学习模型在复杂决策中出现难以检测故障模式且能够无监督采取行动的挑战。通过使用协作方法，我们可以确保安全性，提高性能，并解决透明度和问责制方面的担忧，从而实现有效的决策。

Nov, 2023

模拟人工智能团队决策

研究表明，当涉及到风险元素和评估人类和 AI 代理能力的探索利用过程时，人工智能和人类在小组决策方面具有互补技能。本文面向一组带有缺陷的 AI 代理人，向人类团队提交一系列智力问题，以评估团队成员和可用 AI 代理人的相对专业知识，评估不同行动的风险并通过达成共识来最大化整体回报，并提出了人工智能 - 人类团队决策的模型。研究验证了在不确定情况下的人工智能团队和人类行为预测中的前景理论、影响动态和贝叶斯学习的社会认知构建的价值。

Jan, 2022

人工智能与人类的融合决策系统学习范式

每天我们越来越依赖于机器学习模型来自动化和支持高风险任务和决策。这篇论文提出了混合决策系统的分类法，提供了一个概念和技术框架，以理解当前计算机科学文献中的人机交互模型。

Feb, 2024

利用人类辅助完成顺序决策任务的最新进展

本文综述了五种最近主要依赖于人类指导的机器学习框架及其动机，假设和实施，并讨论可能的未来研究方向。

Jul, 2021

第二决策者的警报：人工智能冲突简介

这篇论文系统地介绍了人工智能与人类协作时可能出现的观察、解释和行动上的冲突，包括其潜在风险、测量方法、影响因素，并强调了这是一个正在崛起的风险领域，需要与传统的故障和失效分析区分开来。

May, 2023

在高风险环境中指导人类学习

本文研究 AI 辅助决策的团队决策，在考虑决策者面临的协同成本、不完美的算法决策等限制条件下，研发了人工智能团队学习框架和 TeamRules 算法，可提供有针对性的决策建议并在处理协同成本和团队准确性之间的平衡上产生显著的效果

Oct, 2022

智能物理人系统中有效的人工智能推荐框架

在涉及人工智能平台向人类决策者提供建议但最终决策责任由人类承担的网络物理人系统中，人类决策者可能因各种原因偏离最优建议决策，本文提出了一个严格的框架来解决这个问题，并建立了最优建议策略的结构属性和人工智能使用的近似人类模型，提供了一个数值实例以说明结果的有效性。

Mar, 2024