Jan, 2024

A2C:一个面向人工智能团队的模块化多阶段协作决策框架

TL;DR该论文介绍了 A2C,一个多阶段协作决策框架,旨在实现人工智能与人类团队之间的强大决策能力。在概念上借鉴了拒绝学习和学习推迟等概念,A2C 将人工智能系统训练成能够识别决策的不确定性,并在需要时推迟决策以便向人类专家求助。此外,A2C 还适用于人类专家面临限制的场景,例如在网络安全运营中心的事件检测和响应中。在这些场景下,A2C 促进协作探索,实现复杂挑战的集体解决。通过支持自动化、增强和协作三种不同的人工智能决策模式,A2C 为开发有效的人工智能协作策略提供了灵活的平台。通过发挥人类和人工智能的优势,它显著提高了动态和不断变化环境中复杂决策的效率和效果。为了验证 A2C 的能力,我们使用基准数据集进行了广泛的模拟实验。结果清楚地表明,A2C 能够有效支持三种决策模式。尤其值得注意的是,(模拟)人类专家和人工智能的协作探索相比单独的人工智能表现出更优异的性能,突显了该框架增强人工智能与人类团队决策能力的潜力。